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作者 以 自己 1985 年 在 Bell 实验 室 时 发 表 的 一 篇 论文 为 基础 ， 结 合 自己 的 工 
作 经 验 扩展 成 为 这 本 对 C 程序 员 具 有 珍贵 价值 的 经 典 著 作 。 写 作 本 书 的 出 发 点 不 
是 要 批判 C 语言 ， 而 是 要 帮助 C 程序 员 绕 过 编程 过 程 中 的 陷阱 和 障碍 。 

全 书 分 为 8 章 ， 分 别 从 词法 分 析 、 语 法 语义 、 连 接 、 库 函数 、 预 处 理 器 、 可 
移植 性 缺陷 等 几 个 方面 分 析 了 C 编程 中 可 能 遇 到 的 问题 。 最 后 ， 作 者 用 --- 章 的 篇 
幅 给 出 了 若干 具有 实用 价值 的 建议 。 

本 书 适合 有 一 定 经 验 的 C 程序 员 阅 读 学 习 ， 即 便 你 是 C 编程 高 手 ， 本 书 也 应 
该 成 为 你 的 案头 必 备 书籍 。 


中 文 版 序 


我 动笔 写作 《C 缺陷 与 陷阱 》 时 ， 可 设想 到 14 年 后 这 本 书 仍然 在 印行 ! 它 之 
所 以 历久 不 衰 ， 我 想 ， 可 能 是 书 中 道 出 了 C 语言 编程 中 一 些 重 要 的 经 验 教训 。 就 
是 到 今天 ， 这 些 教 训 也 还 没有 广为人知 。 

C 语言 中 那些 容易 导致 人 犯错 误 的 特性 , 往往 也 正 是 编程 老手 们 为 之 吸引 的 特 
性 。 因此 ， 大 多 数 程序 员 在 成 长 为 C 编程 高 手 的 道路 上 ， 犯 过 的 错误 真是 惊人 地 相 
似 ! 只 要 C 语言 还 能 继续 感召 新 的 程序 员 投身 其 中 ， 这 些 错误 就 还 会 一 犯 再 犯 。 


大 家 通常 读 到 的 程序 设计 书籍 中 ， 那 些 作 者 总 是 认为 ， 要 成 为 一 个 优秀 的 程 
序 员 ， 最 重要 的 无 非 是 学 习 一 种 特定 程序 语言 、 函 数 库 或 者 操作 系统 的 细节 ， 而 
且 多 多 益 善 。 当 然 ， 这 种 观念 不 无 道理 ， 但 也 有 偏颇 之 处 。 其 实 ， 掌 握 细节 并 不 
难 ， 一 本 索引 丰富 完备 的 参考 书 就 已 经 足 侨 ; 最 多 ， 可 能 还 需要 一 位 稍 有 经 验 的 
同事 不 时 从 旁 点 拨 ， 指 明 方向 。 难 的 是 那些 我 们 已 经 了 解 的 东西 ， 如 何 “ 运 用 之 
妙 ， 存 乎 一 心 ”。 

学 习 哪 些 是 不 应 该 做 的 , 倒 不 失 为 一 条 领悟 运用 之 道 的 路 子 。 程序 设计 语言 ， 
就 比如 说 C 吧 ， 其 中 那些 让 精 于 编程 者 觉得 称心 应 手 之 处 ， 也 格外 容易 误 用 ;而 
经 验 丰 富 的 老手 ， 甚 至 可 以 如 有 “ 先 见 之 明 ” 般 ， 指 出 他 们 误 用 的 方式 。 研 究 一 
种 语言 中 程序 员 容 易 犯 错 之 处 ， 不 但 可 以 “前 车 之 履 ， 后 车 之 鉴 ” 还 能 使 我 们 更 
说 熟 这 种 语言 的 深层 运作 机 制 。 

知悉 本 书 中 文 版 即 出 ， 将 面 对 更 为 广大 的 中 国 读者 ， 我 尤为 欣喜 。 如 果 您 正 
在 读 这 本 书 ， 我 真挚 地 希望 ， 它 能 对 您 有 所 神 益 ， 为 您 释疑 解 惑 ， 让 您 体会 编程 
之 乐 。 

Andrew Koenig 


美国 新 泽 西 州 吉 列 
2002 年 10 月 





对 于 经 验 丰 富 的 行家 而 言 ， 得 心 应 手 的 工具 在 初学 时 的 困难 程度 往往 要 超过 
那些 容易 上 手 的 工具 。 刚 刚 接触 飞机 驾驶 的 学 员 ， 初 航 时 总 是 说 小 慎 微 ， 只 敢 沿 
着 海岸 线 来 四 飞 行 ， 等 他 们 稍 有 经 验 就 会 明白 这 样 的 飞行 其 实 是 一 件 多 么 轻松 的 
事 。 初 学 骑 自 行车 的 新 手 ， 可 能 觉得 后 轮 两 侧 的 辅助 轮 很 有 帮助 ， 但 一 旦 熟练 过 
后 ， 就 会 发 现 它们 很 是 碍 手 碍 脚 。 

这 种 情况 对 程序 设计 语言 也 是 一 样 。 任 何 一 种 程序 设计 语言 ， 总 存在 一 些 语 
言 特性 ， 很 可 能 会 给 还 没有 完全 熟悉 它们 的 人 带 来 麻烦 。 令 人 吃惊 的 是 ， 这 些 特 
性 虽然 因 程序 设 计 语言 的 不 同 而 异 ， 但 对 于 特定 的 一 种 语言 ， 几 乎 每 个 程序 员 都 
是 在 同样 的 一 些 特性 上 犯 过 错误 、 吃 过 苦头 ! 内 此 ， 作 者 也 就 萌生 了 将 这 些 程序 
员 易 犯 错误 的 特性 加 以 收集 、 整 理 的 最 初 念头 。 

我 第 一 次 尝试 收集 这 类 问题 是 在 1977 年 。 当 时 ， 在 华盛顿 特区 举行 的 一 次 
SHARE (IBM 大 型 机 用 户 组 ) 会 议 上 ， 我 作 了 一 次 题 为 “PILI 中 的 问题 与 “ 陷 
阱 '” 的 发 言 。 作 此 发 言 时 ， 我 刚 从 哥伦比亚 大 学 调 至 AT&T 的 贝尔 实验 室 ， 在 
哥伦比亚 大 学 我 们 主要 的 开发 语言 是 PLAI， 而 贝尔 实验 室 中 主要 的 开发 语言 却 是 
C。 在 贝尔 实验 室 工作 的 10 年 间 ， 我 积累 了 丰富 的 经 验 ， 深 说 C 程序 员 ( 也 包括 
我 本 人 ) 在 开发 时 如 果 一 知 半 解 将 会 遇 到 多 少 麻烦 。 

1985 年 , 我 开始 收集 有 关 C 语言 的 此 类 问题 ， 并 在 年 底 将 结果 整理 后 作为 一 
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篇 内 部 论文 发 表 。 这 篇 论文 所 引发 的 回应 却 大 大 出 乎 我 的 意料 ， 共 有 2 000 多 人 
向 贝尔 实验 室 的 图 书馆 索取 该 论文 的 副本 ! 我 由 此 确信 有 必要 将 该 论文 的 内 容 进 
一 步 扩充 ， 于 是 就 写成 了 现在 读者 所 看 到 的 这 本 书 。 

本 书 是 什么 


本 书 力 图 通过 揭示 一 般 程序 员 ， 甚 至 是 经 验 老 道 的 职业 程序 员 ， 如 何在 编程 
中 犯错 误 、 摔 跟头 ， 以 提倡 和 鼓励 预防 性 的 程序 设计 。 这 些 错误 实际 上 一 旦 被 程 
序 员 真正 认识 和 和 理解， 并 不 难 避 免 。 因 此 ， 本 书 曾 述 的 重点 不 是 一 般 原 则 ， 而 是 
一 个 个 具体 的 例子 。 

如 果 你 是 一 个 程序 员 并 且 开 发 中 真正 用 到 C 语言 来 解决 复杂 问题 这 本 书 应 
该 成 为 你 的 案头 必 备 书籍 。 即 使 你 已 经 是 一 个 C 语言 的 专家 级 程序 员 ， 仍 然 有 必 
要 拥有 这 本 书 ， 很 多 读 过 本 书 早 期 手稿 的 专业 C 程序 员 常 常 感叹 :“ 就 在 上 星期 
我 还 遇 到 这 样 一 个 Bug !” 如 果 你 正在 教授 C 语言 课程 ， 本 书 毫 无 疑问 应 该 成 为 
你 向 学 生 推荐 的 首选 补充 阅读 材料 。 

本 书 不 是 什么 


本 书 不 是 对 C 语言 的 批评 。 程 序 员 无 论 使 用 何 种 程序 设计 语言 ， 都 有 可 能 遇 
到 麻 燃 。 本 书 浓缩 了 作者 长 达 10 年 的 C 语言 开发 经 验 ， 和 集中 阐述 了 C 语言 中 各 
种 问题 和 “陷阱 ”目的 是 希望 程序 员 读 者 能 够 从 中 吸取 我 本 人 以 及 我 所 见 过 的 其 
他 人 所 犯错 误 的 经 验 教训 。 

本 书 不 是 一 本 “ 襄 饪 菜谱 ”。 我 们 不 能 希望 可 以 通过 详尽 的 指导 说 明 来 完全 
避免 错误 。 如 果 可 行 的 话 ， 那 么 所 有 的 交通 事故 都 可 以 通过 在 路 旁 刷 上 “小 心 轰 
驶 ”的 标语 来 杜绝 。 对 一 般 人 而 言 最 有 效 的 学 习 方式 是 从 感性 的 、 活 生生 的 事例 
中 学 习 ， 比 如 自己 的 亲身 经 历 或 者 他 人 的 经 验 教训 。 而 且 ， 哪 怕 只 是 明白 了 一 种 
特定 的 错误 是 如 何 可 能 发 生 的 ， 就 已 经 在 将 来 避免 该 错误 的 路 上 迈 了 一 大 步 。 

本 书 并 不 打算 教 你 如 何 用 C 语言 编程 ( 见 Kernighan 和 Ritchie: The C 
Programming Language， 第 2 版 ，Prentice-Hall，1988)， 也 不 是 一 本 CC 语言 参考 
手册 ( 见 Harbison 和 Steele: C: 4 Reference Manual， 第 2 版 ，Prentice-Hall， 
1987)。 本 书 未 提 及 数据 结构 与 算法 ( 见 Van Wyk: Data Structures And C Programs， 
Addison-Wesiey，1988)， 仅 仅 简 路 介绍 了 可 移植 性 〈 见 Horton: How To Write 


前 


wm 


Portable Programs In C，Prentice-Hall，1989〉 和 操作 系统 接口 ( 见 Kernighan 和 
Pike: The Unix Programming Environment，Prentice-Hall，1984)。 本 书 中 所 涉及 
的 问题 均 来 自 编程 实践 ， 适 当 作 了 简化 《如 果 希 望 读 到 一 些 “ 控 空心 思 ” 设 计 出 
来 ,专门 让 你 绞 尽 脑 汁 的 CC 语言 难题 , 见 Feuer: The C Puzzle Book，Prentice-Hall， 
1982)。 本 书 既 不 是 一 本 字典 也 不 是 一 本 百科 全 书 , 我 力图 使 其 精简 短小 ， 以 鼓励 
读者 能 够 阅读 全 书 。 

读者 的 参与 和 贡献 


可 以 肯定 ， 我 遗漏 了 某 些 值得 注意 的 问题 。 如 果 你 发 现 了 一 个 C 语言 问题 而 
本 书 又 未 提 及 ， 请 通过 Addison-Wesley 出 版 社 与 我 联系 。 在 本 书 的 下 一 版 中 ， 我 
很 有 可 能 引用 你 的 发 现 ， 并 且 向 你 致谢 。 

关于 ANSI C 


在 我 写作 本 书 时 ，ANSI C 标准 尚未 最 后 定案 。 严 格 地 说 ， 在 ANSI 委员 会 完 
成 其 工作 之 前 , “ANSI C” 的 提 法 从 技术 上 而 言 是 不 正确 的 。 而 实际 上 ，ANSI 
标准 化 工作 大 体 已 经 尘埃 落 定 ， 本 书 中 提 及 的 有 关 ANSI C 标准 内 容 基本 上 不 可 
能 有 所 变动 。 很 多 C 编译 器 甚至 已 经 实现 了 大 部 分 ANSI 委员 会 所 考虑 的 对 C 语 
言 的 许多 重大 改进 。 

址 需 担 心 你 使 用 的 C 编译 器 并 不 支持 书 中 出 现 的 ANSI 标准 函数 语法 ， 它 并 
不 会 妨碍 你 理解 例子 中 真正 重要 的 内 容 ， 而 且 书 中 提 及 的 程序 员 易 犯错 误 其 实 与 
何 种 版 本 的 C 编译 器 并 无 太 大 关系 。 

致谢 


本 书 中 问题 的 收集 整理 工作 绝 非 一 人 之 力 可 以 完成 。 以 下 诸位 都 向 我 指出 过 
C 语言 中 的 特定 问题 , 他 们 是 Steve Bellovin (6.3 节 ), Mark Brader (1.1 节 ), Luca 
Cardelli (4.4 节 )，Larry Cipriani (2.3 节 )，Guy Harris and Steve Johnson (2.2 节 )， 
Phil Kam (2.2 节 ), Dave Kristol (7.5 节 ), George W. Leach (1.1 节 ), Doug Mcllroy 
(2.3 节 )，Barbara Moo (7.2 节 )，Rob Pike (1.1 节 )，Jim Reeds (3.6 节 )，Dennis 
Ritchie (2.2 节 )，Janet Sirkis (5.2 节 )，Richard Stevens (2.5 节 )，Bjarne Stroustrup 
(2.3 节 )，3phraim Vishnaic (1.4 节 )， 以 及 一 位 自愿 要 求 隐 去 姓名 者 2.3 节 )。 
为 简短 起 见 ， 对 于 同一 个 问题 此 处 仅仅 列 出 了 第 一 位 向 我 指出 该 问题 的 人 。 我 认 
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为 这 些 错误 绝 不 是 凭空 脐 造 出 来 的 ， 而 且 即 使 是 ， 我 想 也 没有 人 愿意 承认 。 至 少 
这 些 错误 我 本 人 几乎 都 犯 过 ， 而 且 有 的 还 不 止 犯 一 次 。 

在 书稿 编辑 方面 许多 有 用 的 建议 来 自 Steve Bellovin， Jim Coplien， Marc 
Donner， Jon Forrest, Brian Kernighan, Doug McIlroy，Barbara Moo, Rob Murray, 
Bob Richton，Dennis Ritchie，Jonathan Shapiro， 以 及 一 些 未 透露 姓名 的 审阅 者 。 
Lee McMahon 与 Ed Sitar 为 我 指出 了 早期 手稿 中 的 许多 录入 错误 ， 使 我 避免 了 
旦 成 书后 将 要 遇 到 的 很 多 烛 输 。 Dave Prosser 为 我 指明 了 许多 ANSIC 中 的 细微 之 
处 。Brian Kermighan 提供 了 极 有 价值 的 排版 工具 和 帮助 。 


与 Addison-Wesley 出 版 社 合作 是 一 件 愉 快 的 事情 ， 感 谢 Jim DeWolf，Mary 
Dyer，Lorraine Ferrier, Katherine Harutunian, Marshall Henrichs, Debbie Lafferty, 
Keith Wollman， 和 Helen Wythe。 当 然 ， 他 们 也 从 一 些 并 不 为 我 所 知 的 人 们 那里 
得 到 了 帮助 ， 使 本 书 最 终 得 以 出 版 ， 我 在 此 也 一 并 致谢 。 

我 需要 特别 感谢 AT&T 贝尔 实验 室 的 管理 层 ， 他 们 开明 的 态度 和 支持 使 我 得 
以 写作 本 书 , 包括 Steve Chappell, Bob Factor, Wayne Hunt, Rob Murray, Will Smith， 
Dan Stanzione 和 Eric Sumner。 

本 书 书 名 受到 Robert Sheckiey 的 科幻 小 说 选集 的 启发 , 其 书 名 是 The People 
Trap and Other Pitfalls, Snares, Devices and Delusions (as well as Two Sniggles 
and a Contrivance )(1968 年 由 Dell Books 出 版 )。 





第 0 章 
第 1 章 


1.1 
1.2 
1.3 
1.4 
1.5 


第 2 章 


2.1 
2.2 
2.3 
2.4 
2:5 
2.6 





导读 1 
词法 色 陷阱 ” 人 5 
= 不 同 于 = 6 
&& 和 | 不 同 于 &&& 和 8 
词法 分 析 中 的 “贪心 法 8 
整 型 常量 10 
字符 与 字符 囊 … 11 
语法 “陷阱 ”ee 15 
理解 应 数 声明 ……… 15 
运 咎 符 的 优先 级 间 题 ee 19 
注意 作为 语 名 结束 标志 的 分 号 和 ee 24 
SWiteh 语句 和 26 
务 数 调用 en 28 
“悬挂 ”else 引发 的 问题 站 ee 29 


C 陷阱 与 缺陷 





第 3 壮 滞 义 “陷阱 0 33 
3;1 指针 与 数组 sgn 33 
32， 非 数 组 的 指针 mn na 39 
3.3 ”作为 参数 的 数组 声明 .cc 41 
3 和 旭 的 了 关 读 二 43 
3.5 空 指 针 并 非 空 字符 史 ee 44 
3.6 ”边界 计算 与 不 对 称 边界 45 
357 < 未 值 顾 记 生生 全 全 全 记 克 人 全 人 人 57 
3:8 运算 符 和 Se 四 在 59 
3.9." 歼 数 溢出 a on 二 61 
3.10 为 函数 main 提供 返回 条 62 

第 水 章 连接 to 65 
4.1 “什么 是 连接 器 DD 65 
424 启明 与 定义 ne 67 
4.3 ”命名 冲突 与 static 修饰 符 69 
4.4” 形 参 、 实 参与 返回 值 .ns 70 
4.5。: 丛 查 外 部 类 型， nd 77 
4:0. RICfD De 80 

第 SS 天 人: 库 本 类 2 83 
5.1 返回 整数 的 getchar 函数 84 
5 :时 疡 顺序 文件 ome ee 85 
5.3 缓冲 输出 与 内 存 分 配 86 
5.4 ”使 用 errno 检测 错误 88 
5.5 库 函 数 于 89 

第 6 惠 二 预 处理 星 全 93 





6.1 不 能 色 视 宏 定义 中 的 空格 cns 94 
892. 实 并 不 是 阴 数 ws 94 
6 3 宏 并 不 是 语句 .ono 乓 和 让 让 人 99 
6 天 实 并 不 是 类 型 守信 Donn depo 101 
第 了 7 塞 . ,可 移植 性 缺陷 让 nDmee ee 103 
7.1 应 对 C 语言 标准 变更 .0 104 
7.2 标识 符 名 称 的 限制 00.00000555c5cssssseeseeee 106 
pin 1 De OR ee 107 
7.4 ”字符 是 有 符号 整数 还 是 无 符号 整数 108 
275 移 位 运算 符 :ws0os 0 109 
76 0 内 站 科 置 (0550 110 
7.7 ”除法 运算 时 发 生 的 截断 .0 111 
7%8 随机 数 的 兴 直 en 113 
0 小 写 转 机 113 
7.10 首先 释放 ， 然 后 重新 分 配 ...50.555 115 
7.11 可 移植 性 问题 的 -个 例子 116 
第 8 章 - 巡 议 与 答案 :区 手 生 全 生生 全 各所 121 
BT 122 
dt 126 
附录 A PRINTF, VARARGS 与 STDARG.. 145 
附录 B ”Koenig 和 Moo 夫妇 访谈 .ee 167 





EE 


-2 
军 





导 读 





我 的 第 一 个 计算 机 程序 写 于 1966 年 ， 是 用 Fortran 语言 开发 的 。 该 程序 需要 
完成 的 任务 是 计算 并 打印 输出 10 000 以 内 的 所 有 Fibonacci 数 ,也 就 是 一 个 包括 1， 
1, 2, 3, 5, 8, 13, 21, “ee** 等 元 素 的 数列 ， 其 中 第 2 个 数字 之 后 的 每 个 数字 都 
是 前 两 个 数字 之 和 。 当 然 ， 写 程序 代码 很 难 第 一 次 就 顺利 通过 编译 : 


[本 
my 
;| 
HH 
到 
全 
已 
次 


并 = 工 十 可 

IF (K - 10000) 1, 1, 2 
2 CALL EXIT 
10 FORMAT {I10) 


Fortran 程序 员 很 容易 发 现 上 面 这 段 代 码 遗 漏 了 一 个 END 语句 。 当 我 添上 
END 语句 之 后 ， 程 序 还 是 不 能 通过 编译 ， 编 译 器 的 错误 消息 也 让 人 迷惑 不 解 : 
ERROR 6。 

通过 仔细 查阅 编译 器 参考 手册 中 对 错误 消息 的 说 明 ， 我 最 后 终于 明白 了 问题 

贿 包 位 数 上 上 的 整 型 常量 。 将 上 面 这 段 代 码 





C 陷阱 与 缺陷 


中 的 10000 改 为 9999， 程 序 就 顺利 通过 了 编译 。 
我 的 第 一 个 C 程序 写 于 1977 年 。 当 然 ， 第 一 次 还 是 没有 得 到 正确 结果 : 


#include <stdio.h> 


main() 
{ 
printf ("Hello world"),; 


这 段 代码 虽然 在 编译 时 一 次 通过 , 但 是 , 程序 执行 的 结果 看 上 去 却 有 点 奇怪 。 
终端 输出 差不多 就 是 下 面 这 样 ; 

% CC prog.c 

8 a.out 


Hello world%® 


这 里 的 % 字 符 是 系统 提示 符 ， 操 作 系 统 用 它 来 提示 用 户 输 入 。 因 为 在 程序 中 
没有 写 明 “Hello world” 消 息 之 后 应 该 换行 ， 所 以 系统 提示 符 % 直 接 出 现在 输出 
的 “Hello world” 消 息 之 后 。 这 个 程序 中 还 有 一 个 更 加 难以 察觉 的 错误 ， 将 在 本 
书 的 3.10 节 加 以 讨论 。 


上 面 提 到 的 两 个 程序 中 所 出 现 的 错误 ， 是 有 着 实质 区 别 的 两 种 不 同类 型 的 错 
误 。 在 Fortran 程序 的 例子 中 出 现 了 两 个 错误 , 但 是 这 两 个 错误 都 能 够 被 编译 器 检 
测 出 来 。 而 C 程序 的 例子 从 技术 上 说 是 正确 的 ， 至 少 从 计算 机 的 角度 来 看 它 没有 
错误 。 因 此 ，C 程序 顺利 通过 了 编译 ， 没 有 报告 任何 警告 或 错误 消息 。 计 算 机 严 
格 地 按照 我 写 明 的 程序 代码 来 执行 ， 但 结果 却 并 不 是 我 真正 希望 得 到 的 。 


本 书 所 要 集中 讨论 的 是 第 二 类 问题 ， 也 就 是 程序 并 没有 按照 程序 员 所 期 待 的 
方式 执行 。 更 进一步 , 本 书 的 讨论 限定 在 C 语言 程序 中 可 能 产生 这 类 错误 的 方式 。 
例如 ， 考 虑 下 面 这 段 代 码 ; 

nt i 

int al[N]; 

for (i = 0; i <= N; i++) 


a[i] = 0; 


第 0 章 导读 





这 段 代 码 的 作用 是 初始 化 一 个 N 元 数组 , 但 是 在 很 多 C 编译 器 中 , 它 将 会 陷 
入 一 个 死 循环 ! 本 书 的 3.6 节 讨 论 了 为 什么 会 这 样 的 原因 。 


程序 设计 错误 实际 上 反映 的 是 程序 与 程序 员 对 该 程序 的 “心智 模式 ”" 两 者 
的 相 异 之 处 。 从 程序 错误 的 本 性 而 言 ， 我 们 很 难 给 它们 进行 恰当 的 分 类 。 对 一 个 
程序 错误 可 以 从 不 同 层面 采用 不 同方 式 进行 考察 ， 根 据 程序 错误 与 考察 程序 的 方 
式 之 间 的 相关 性 ， 我 尝试 着 对 程序 错误 进行 了 划分 。 
译注 @: 心智 模式 (mental model ) 在 彼得 - 圣 吉 的 《第 五 项 修炼 一 一 学 习 型 组 
织 的 艺术 与 实务 》 ( 上 海 三 联 书店 ，1998 年 第 2 版 ) 中 也 有 提 到 ， 被 解释 为 “人 们 
深 植 心中 ， 对 于 周遭 世界 如 何 运作 的 看 法 和 行为 ”。Howard Gardner 在 研究 认 知 科 
学 的 一 本 著作 《心灵 的 新 科学 》 ( The Mind's New Science ) 中 认为 ， 人 们 的 心智 模 
式 决 定 了 人 们 如 何 认识 周遭 世界 。 《列子 》 一 书 中 有 个 典型 的 故事 ， 说 有 个 人 遗失 
了 一 把 低头 ,他 怀疑 是 邻居 孩子 偷 的 ， 暗 中 观察 他 的 行为 ， 怎 么 看 怎么 像 偷 佐 头 的 
人 ; 后 来 他 在 自己 家 中 找到 了 遗失 的 伯 头 ， 再 磁 到 邻居 的 孩子 时 ， 怎 么 看 也 不 像 会 
是 偷 他 和 丛 头 的 人 了 。 


从 较 低 的 层面 考察 ， 程 序 是 由 符号 〈token) 序列 所 组 成 的 ， 正 如 一 本 书 是 由 
一 个 一 个 单词 所 组 成 的 一 样 。 将 程序 分 解 成 符号 的 过 程 ， 称 为 “词法 分 析 ”。 第 1 
章 考察 在 程序 被 词法 分 析 器 分 解 成 各 个 符号 的 过 程 中 可 能 出 现 的 问题 。 


组 成 程序 的 这 些 符号 ， 又 可 以 看 成 是 语句 和 声明 的 序列 ， 就 好 像 一 本 书 可 以 
看 成 是 由 单词 进一步 结合 而 成 的 句子 所 组 成 的 集合 。 无 论 是 对 于 书 而 寺 ， 还 是 对 
于 程序 而 言 ， 符 号 或 者 单词 如 何 组 成 更 大 的 单元 〈 对 于 前 者 是 语句 和 声明 ， 对 于 
后 者 是 句子 ) 的 语法 细节 最 终 决 定 了 语义 。 如 果 没 有 正确 理解 这 些 语法 细节 ， 将 
会 出 现 怎样 的 错误 呢 ? 第 2 章 就 此 进行 了 讨论 。 

第 3 章 处 理 有 关 语 义 误 解 的 问题 : 即 程序 员 的 本 意 是 希望 表示 某 种 事物 ， 而 
实际 表示 的 却 是 另外 一 种 事物 。 在 这 一 章 中 我 们 假定 程序 员 对 词法 细节 和 语法 细 
节 的 理解 没有 问题 ， 因 此 着 重 讨论 语义 细节 。 

第 4 章 注意 到 这 样 一 个 事实 ，C 程序 经 常 是 由 若干 个 部 分 组 成 ， 它 们 分 别 进 
行 编译 ， 最 后 再 整合 起 来 。 这 个 过 程 称 为 “连接 ”， 是 程序 和 其 支持 环境 之 间 关 系 
的 一 部 分 。 


程序 的 支持 环境 包括 某 组 库 函 数 (library routine)。 虽 然 严 格 说 来 库 函 数 并 不 
是 语言 的 一 部 分 ， 但 是 库 函 数 对 任何 一 个 有 用 的 程序 都 非常 重要 。 特 别 地 ， 有 些 
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库 函 数 几乎 每 个 C 程序 都 要 用 到 。 对 这 些 库 函数 的 误 用 可 以 说 是 五 花 八 门 ， 因 此 
值得 在 第 5 章 中 专门 讨论 。 

在 第 6 章 ， 我 们 还 注意 到 ， 由 于 C 预 处 理 器 的 介入 ， 实 际 运行 的 程序 并 不 是 
最 初 编写 的 程序 。 虽 然 不 同 预 处 理 器 的 实现 存在 或 多 或 少 的 差异 ， 但 是 大 部 分 特 
性 是 各 种 预 处 理 器 都 支持 的 。 第 6 章 讨论 了 与 这 些 特性 有 关 的 有 用 内 容 。 

第 7 章 讨论 了 可 移植 性 问题 ， 也 就 是 为 什么 在 一 个 实现 平台 上 能 够 运行 的 程 
序 却 无 法 在 另 一 个 平台 上 运行 。 当 牵涉 到 可 移植 性 时 ， 哪 怕 是 非常 简单 的 类 似 整 
数 的 算术 运算 这 样 的 事情 ， 其 困难 程度 也 常常 会 出 人 意料 。 

第 8 章 提供 了 有 关 预 防 性 程序 设计 的 一 些 建议 ， 还 给 出 了 其 他 章节 的 练习 解 
答 。 

最 后 ， 附 录 中 讨论 了 3 个 常用 的 却 普遍 地 被 误解 的 库 函数 。 

练习 0-1。 你 是 否 愿意 购买 一 个 返修 率 很 高 的 厂家 所 生产 的 汽车 如 果 厂家 
声明 它 已 经 做 出 了 改进 ， 你 的 态度 是 否 会 改变 ? 用 户 为 你 找 出 程序 中 的 Bug， 你 
真正 损失 的 是 什么 ? 

练习 0-2， 修建 一 个 100 英尺 长 的 护栏 ,护栏 的 栏杆 之 间 相距 10 英尺 ， 你 需 
要 多 少 根 栏杆 ? 

练习 0-3。 在 京 饪 时 你 是 否 失手 用 菜刀 切 伤 过 自己 的 手 ? 怎样 改进 菜刀 使 得 
使 用 更 安全 ? 你 是 否 愿意 使 用 这 样 一 把 经 过 改良 的 菜刀 ? 





第 
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当 我 们 阅读 一 个 句子 时 ， 我 们 并 不 去 考虑 组 成 这 个 句子 的 单词 中 单个 字母 的 
含义 ， 而 是 把 单词 作为 一 个 整体 来 理解 。 确 实 ， 字 母 本 身 并 没有 什么 意义 ， 我 们 
总 是 将 字母 组 成 单词 ， 然 后 给 单词 赋予 一 定 的 意义 。 


对 于 用 C 语言 或 其 他 语言 编写 的 程序 ， 道 理 也 是 一 样 的 。 程 序 中 的 单个 字符 
孤立 来 看 并 没有 什么 意义 ， 只 有 结合 上 下 文才 有 意义 。 因 此 ， 在 p->s = "->"; 这 个 
语句 中 ， 两 处 出 现 的 -字符 的 意义 大 相 径 庭 。 更 精确 地 说 ， 上 式 中 出 现 的 两 个 "- 
字符 分 别 是 不 同 符号 的 组 成 部 分 : 第 一 个 字符 是 符号 -> 的 组 成 部 分 ， 而 第 二 个 ~ 
字符 是 一 个 字符 串 的 组 成 部 分 。 此 外 ， 符 号 -> 的 含义 与 组 成 该 符号 的 字符 -或 字 
符 >' 的 含义 也 完全 不 同 。 

术语 “符号 ”(token) 指 的 是 程序 的 一 个 基本 组 成 单元 ， 其 作用 相当 于 一 个 
句子 中 的 单词 。 从 某 种 意义 上 说 ， 一 个 单词 无 论 出 现在 哪个 句子 ， 它 代表 的 意思 
都 是 一 样 的 ， 是 一 个 表 义 的 基本 单元 。 与 此 类 似 ， 符 号 就 是 程序 中 的 一 个 基本 信 
息 单元 。 而 组 成 符号 的 字符 序列 就 不 同 ， 同 一 组 字符 序列 在 某 个 上 下 文 环境 中 属 
于 一 个 符号 ， 而 在 另 一 个 上 下 文 环境 中 可 能 属于 完全 不 同 的 另 一 个 符号 。 
译注 如 上 面 的 字符 … 和 字符 >' 级 成 的 字符 序列 ->， 在 不 同 的 上 下 文 环境 中 ， 一 
个 代表 -> 运算 符 ， 一 个 代表 字符 囊 "->"。 


编译 器 中 负责 将 程序 分 解 为 一 个 一 个 符号 的 部 分 ， 一 般 称 为 “词法 分 析 器 ”。 
再 看 下 面 一 个 例子 ， 语 句 : 
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if (x > big) big = x; 

这 个 语句 的 第 一 个 符号 是 C 语言 的 关键 字 ff， 紧 接着 下 一 个 符号 是 左 括号 ， 
再 下 一 个 符号 是 标识 符 x, 再 下 一 个 是 大 于 号 , 再 下 一 个 是 标识 符 big, 依次 类 推 。 
在 C 语 言 中 ， 符 号 之 间 的 空白 (包括 空格 符 、 制 表 符 或 换行 符 〉 将 被 忽略 ， 因 此 
上 面 的 语句 还 可 以 写成 : 


if 


本 章 将 探讨 符号 和 组 成 符号 的 字符 间 的 关系 ， 以 及 有 关 符 号 含义 的 一 些 常见 
误解 。 


1.1 = 不 同 于 == 


由 Algol 派生 而 来 的 大 多 数 程序 设计 语言 ， 例 如 Pascal 和 Ada， 使 用 符号 := 
作为 赋值 运算 符 ， 符 号 = 作为 比较 运算 符 。 而 C 语言 使 用 的 是 另 一 种 表示 法 ， 符 
号 = 作为 赋值 运算 ， 符 号 = = 作为 比较 。 一 般 而 言 ， 赋 值 运算 相对 于 比较 运算 出 现 
得 更 频繁 ， 因 此 字符 数 较 少 的 符号 = 就 被 赋予 了 更 常用 的 含义 一 一 赋值 操作 。 此 
外 ,在 C 语言 中 赋值 符号 被 作为 一 种 操作 符 对 待 ， 因 而 重复 进行 赋值 操作 (如 
a=b=c) 可 以 很 容易 地 书写 ， 并 且 赋 值 操作 还 可 以 被 嵌入 到 更 大 的 表达 式 中 。 


这 种 使 用 上 的 便利 性 可 能 导致 一 个 潜在 的 问题 ， 当 程序 员 本 意 是 作 比 较 运算 
时 ， 却 可 能 无 意 中 误 写成 了 赋值 运算 。 比 如 下 例 ， 该 语句 本 意 似乎 是 要 检查 x 是 
否 等 于 y: 
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if (x = Y) 
break; 
而 实际 上 是 将 y 的 值 赋 给 了 x， 然 后 检查 该 值 是 否 为 零 。 再 看 下 面 一 个 例子 ， 本 
例 中 循环 语句 的 本 意 是 跳 过 文件 中 的 空格 符 、 制 表 符 和 换行 号 : 
while {es © The == \t. Le = "Nh') 
c= Getc (f); 

由 于 程序 员 在 比较 字符 '' 和 变量 c 时 ， 误 将 比较 运算 符 = = 写成 了 赋值 运算 符 
=。 因 为 赋值 运算 符 = 的 优先 级 要 低 于 逻辑 运算 符 1 ， 因 此 实际 上 是 将 以 下 表达 
式 的 值 赋 给 了 c: 

we EN 

因为 '' 不 等 于 零 ('' 的 ASCII 码 值 为 32)， 那 么 无 论 变 量 c 此 前 为 何 值 ， 
上 述 表 达 式 求 值 的 结果 都 是 1， 因 此 循环 将 一 直 进 行 下 去 直到 整个 文件 结束 。 文 
件 结束 之 后 循环 是 否 还 会 进行 下 去 ， 这 取决 于 getc 库 函 数 的 具体 实现 ， 在 文件 指 
针 到 达 文件 结尾 之 后 是 否 还 允许 继续 读 取 字 符 。 如 果 人 允许 继续 读 取 字 符 ， 那 么 特 
环 将 一 直 进行 ， 从 而 成 为 一 个 死 循环 。 

某 些 C 编译 器 在 发 现形 如 el = e2 的 表达 式 出 现在 循环 语句 的 条 件 判断 部 分 
时 ， 会 给 出 警告 消息 以 提醒 程序 员 。 当 确实 需要 对 变量 进行 赋值 并 检查 该 变量 的 
新 值 是 否 为 0 时， 为 了 避免 来 自 该 类 编译 器 的 警告 ， 我 们 不 应 该 简单 关闭 警告 先 
项 ， 而 应 该 显 式 地 进行 比较 。 也 就 是 说 ， 下 例 


if (x = y) 
foo () ; 
应 该 写作 : 
if {(x = y) != 0) 
foo(); 


这 种 写法 也 使 得 代码 的 意图 一 目 了 然 。 至 于 为 什么 要 用 括号 把 x =y 括 起 来 ， 
本 书 的 2.2 节 将 讨论 这 个 问题 。 

前 面 一 直 谈 的 是 把 比较 运算 误 写 成 赋值 运算 的 情形 ， 另 一 方面 ， 如 果 把 赋值 
运算 误 写成 比较 运算 ， 辣 样 会 造成 混淆 : 

if ((filedesc == open(argv[il]，0)) < 0) 


error(); 
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在 本 例 中 ， 如 果 函 数 open 执行 成 功 ， 将 返回 0 或 者 正 数 ， 而 如 果 函 数 open 
执行 失败 ， 将 返回 -1。 上 面 这 段 代 码 的 本 意 是 将 函数 open 的 返回 值 存储 在 变量 
filedesc 之 中 , 然后 通过 比较 变量 filedesc 是 否 小 于 0 来 检查 函数 open 是 否 执行 成 
功 。 但是， 此 处 的 = = 本 应 是 =。 而 按照 上 面 代码 中 的 写法 ， 实 际 进行 的 操作 是 比 
较 函 数 open 的 返回 值 与 变量 filedesc， 然 后 检查 比较 的 结果 是 否 小 于 0。 因 为 比 
较 运算 符 = = 的 结果 只 可 能 是 0 或 1， 永远 不 可 能 小 于 0， 所 以 函数 error() 将 没有 
机 会 被 调用 。 如 果 代 码 被 执行 ， 似 乎 一 切 正 常 ， 除 了 变量 filedesc 的 值 不 再 是 疝 
数 open 的 返回 值 (事实 上 ， 甚 至 完全 与 函数 open 无 关 )。 某 些 编译 器 在 遇 到 这 种 
情况 时 ， 会 警告 与 0 比较 无 效 。 但 是 ， 作 为 程序 员 不 能 指望 靠 编译 器 来 提醒 ， 毕 
竟 警 告 消息 可 以 被 忽略 ， 而 且 并 不 是 所 有 编译 器 都 具备 这 样 的 功能 。 


1.2 & 和 1 不 同 于 && 和 1 


很 多 其 他 语言 都 使 用 = 作为 比较 运算 符 ， 因 此 很 容易 误 将 赋值 运算 符 = 写成 比 
较 运 算 符 ==。 同样 地 , 将 按 位 运算 符 & 与 逻辑 运算 符 &&, 或 者 将 按 位 运算 符 | 与 
逻辑 运算 符 小 调换 ， 也 是 很 容易 犯 的 错误 。 特别 是 C 语言 中 按 位 与 运算 符 && 和 按 
位 或 运算 符 1， 与 某 些 其 他 语言 中 的 按 位 与 运算 符 和 按 位 或 运算 符 在 表现 形式 上 
完全 不 同 〈 如 Pascal 语言 中 分 别 是 and 和 or)， 更 容易 让 程序 员 因为 受到 其 他 语 
言 的 影响 而 犯错 。 关 于 这 些 运算 符 精确 含义 的 讨论 见 本 书 的 3.8 节 。 


1.3 ”词法 分 析 中 的 “贪心 法 ” 


C 语言 的 某 些 符 号 ， 例 如 / 、* 、 和 和 =， 只 有 一 个 字符 长 ， 称 为 单字 符 符号 。 
而 C 语言 中 的 其 他 符号 ， 例 如 #* 和 = = ， 以 及 标识 符 , 包括 了 多 个 字符 ， 称 为 多 
字符 符号 。 当 C 编译 器 读 入 一 个 字符 后 又 跟 了 一 个 字符 *， 那 么 编译 器 就 必须 
做 出 判断 ， 是 将 其 作为 两 个 分 别 的 符号 对 待 ， 还 是 合 起 来 作为 一 个 符号 对 待 。C 
语言 对 这 个 问题 的 解决 方案 可 以 归纳 为 一 个 很 简单 的 规则 ， 每 一 个 符号 应 该 包含 
尽 可 能 多 的 字符 。 也 就 是 说 ， 编 译 器 将 程序 分 解 成 符号 的 方法 是 ， 从 左 到 右 一 个 
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字符 一 个 字符 地 读 入 ， 如 果 该 字符 可 能 组 成 一 个 符号 ， 那 么 再 读 入 下 一 个 字符 ， 
判断 已 经 读 入 的 两 个 字符 组 成 的 字符 串 是 否 可 能 是 一 个 符号 的 组 成 部 分 ， 如 果 可 
能 ， 继 续 读 入 下 一 个 字符 ， 重 复 上 述 判断 ， 直 到 读 入 的 字符 组 成 的 字符 串 已 不 再 
可 能 组 成 一 个 有 意义 的 符号 。 这 个 处 理 策略 有 时 被 称 为 “贪心 法 ”,， 或者， 更 口语 
化 一 点 ， 称 为 “大 嘴 法 ” Kernighan 与 Ritchie 对 这 个 方法 的 表述 如 下 ,“ 如 果 ( 编 
译 器 的 ) 输入 流 截止 至 某 个 字符 之 前 都 已 经 被 分 解 为 一 个 个 符号 ， 那 么 下 一 个 符 
号 将 包括 从 该 字符 之 后 可 能 组 成 一 个 符号 的 最 长 字符 串 。” 

需要 注意 的 是 ， 除了 字符 串 与 字符 常量 , 符号 的 中 间 不 能 姐 有 空白 (空格 符 、 
制 表 符 和 换行 符 )。 例 如 ，= = 是 单个 符号 ， 而 = = 则 是 两 个 符号 ， 下 面 的 表达 式 

a---b 
与 表达 式 

a -- - b 
的 含义 相同 ， 而 与 

da 
的 含义 不 同 。 同 样 地 ， 如 果 / 是 为 判断 下 一 个 符号 而 读 入 的 第 一 个 字符 ， 而 /之 后 
紧 接 着 *， 那 么 无 论 上 下 文 如 何 ， 这 两 个 字符 都 将 被 当 作 一 个 符号 #， 表 示 一 段 注 
释 的 开始 。 

根据 代码 中 注释 的 意思 ， 下 面 的 语句 的 本 意 似乎 是 用 x 除 以 p 所 指向 的 值 ， 
把 所 得 的 商 再 赋 给 y， 

Y = X/*p /* pp 指向 除数 */; . 

而 实际 上 ，/* 被 编译 器 理解 为 一 段 注释 的 开始 ， 编 译 器 将 不 断 地 读 入 字符 ， 
直到 */ 出 现 为 止 。 也 就 是 说 ， 该 语句 直接 将 x 的 值 赋 给 y， 根 本 不 会 顾及 到 后 面 
出 现 的 p。 将 上 面 的 语句 重 写 如 下 ， 

0 /* DP 指向 除数 */; 

或 者 更 加 清楚 一 点 ， 写 作 : 
Yy = x/(*p) /* pp 指向 除数 */; 
这 样 得 到 的 实际 效果 才 是 语句 注释 所 表示 的 原意 。 
诸如 此 类 的 准 二 义 性 (near-ambiguity〉 问 题 ， 在 有 的 上 下 文 环境 中 还 有 可 能 
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招致 麻烦 。 例如， 老 版 本 的 C 语言 中 允许 使 用 =+ 来 代表 现在 += 的 含义 。 这 种 老 版 
本 的 C 编译 器 会 将 
a==1; 
理解 为 下 面 的 语句 
总 
亦 即 
-i 
因此 ， 如 果 程 序 员 的 原意 是 
a = -1; 
那么 所 得 结果 将 使 其 大 吃 一 惊 。 
另 一 方面 ， 尽 管 /#* 看 上 去 像 一 段 注释 的 开始 ， 在 下 例 中 这 种 老 版 本 的 编译 器 


a =/ *b ; 


而 一 个 严格 的 ANSIC 编译 器 则 会 报错 。 


1.4 整 型 常量 


如 果 一 个 整 型 常量 的 第 一 个 字符 是 数字 0， 那 么 该 常量 将 被 视 作 八进制 数 。 
因此 ，10 与 010 的 含义 截然 不 同 。 此 外 ， 许多 C 编译 器 会 把 8 和 9 也 作为 八进制 
数字 处 理 。 这 种 多 少 有 点 奇怪 的 处 理 方式 来 自 八 进 制 数 的 定义 。 例 如 ，0195 的 含 
义 是 1X8: 十 9X8! 十 5X8?， 也 就 是 141 十进制 ) 或 者 0215 (八进制)。 我 们 当 
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然 不 建议 这 种 用 法 ，ANSI C 标准 也 禁止 这 种 用 法 。 
需要 注意 这 种 情况 ， 有 时 候 在 上 下 文中 为 了 格式 对 齐 的 需要 ， 可 能 无 意 中 将 
十 进 制 数 写成 了 八进制 数 ， 例 如 : 


struct { 
int part_number; 


char *description,; 


}parttab[] = { 
046 ， "left-handed widget" 
047， "right-handed widget" 
T1258; "frammis" 


1.5 字符 与 字符 串 


C 语言 中 的 单 引 号 和 双 引 号 含义 角 异 ， 在 某 些 情 况 下 如 果 把 两 者 弄 混 ， 编 译 
器 并 不 会 检测 报错 ， 从 而 在 运行 时 产生 难以 预料 的 结果 。 

用 单 引号 引起 的 一 个 字符 实际 上 代表 一 个 整数 ， 整 数值 对 应 于 该 字符 在 编译 
器 采用 的 字符 集中 的 序列 值 。 因 此 ， 对 于 采用 ASCII 字符 集 的 编译 器 而 言 ，'a 的 
含义 与 0141 (八进制 ) 或 者 97〈 十 进 制 ) 严格 一 致 。 

用 双 引 号 引起 的 字符 串 ， 代 表 的 却 是 一 个 指向 无 名 数组 起 始 字符 的 指针 ， 该 
数组 被 双 引 号 之 间 的 字符 以 及 一 个 额外 的 二 进 制 值 为 零 的 字符 \0' 初 始 化 。 

下 面 的 这 个 语句 : 

printf ("Hello world\n"); 
与 

char hello[] = {'H', ‘'é', "1', 1', 'O', * 

0 Wo EY 0 
printf (hello); 


是 等 效 的 。 
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因为 用 单 引号 括 起 的 一 个 字符 代表 一 个 整数 ， 而 用 双 引 号 括 起 的 一 个 字符 代 
表 一 个 指针 ,如果 两 者 混用 , 那么 编译 器 的 类 型 检查 功能 将 会 检测 到 这 样 的 错误 。 
例如 : 
char *slash = '/'; 
在 编译 时 将 会 生成 一 条 错误 消息 ， 因 为 /并 不 是 一 个 字符 指针 。 然 而 ， 某 些 C 纺 
译 器 对 函数 参数 并 不 进行 类 型 检查 ， 特 别 是 对 printf 函数 的 参数 。 因 此 ， 如 果 用 
printf('\n'); 
来 代替 正确 的 
printf("\n"); 
则 会 在 程序 运行 的 时 候 产 生 难以 预料 的 错误 ， 而 不 会 给 出 编译 器 诊断 信息 。 本 书 
的 4.4 节 还 详细 讨论 了 其 他 情形 。 
译注 : 现在 的 编译 器 一 般 能 够 检测 到 在 函数 调用 时 混用 单 引 号 和 双 引 号 的 情形 。 





整 型 数 (一 般 为 16 位 或 32 位 ) 的 存储 空间 可 以 容纳 多 个 字符 (一般 为 8 位 )， 
因此 有 的 C 编译 器 允许 在 一 个 字符 常量 〈 以 及 字符 串 常量 ) 中 包括 多 个 字符 。 也 
就 是 说 ， 用 'yes' 代 替 "yes" 不 会 被 该 编译 器 检测 到 。 后 者 〈 即 "yes") 的 含义 是 “ 依 
次 包含 Y%'、 避 、' 以 及 空 字 符 \0' 的 4 个 连续 内 存单 元 的 首 地 址 ”。 前 者 ( 即 'yes') 
的 含义 并 没有 准确 地 进行 定义 ， 但 大 多 数 C 编译 器 理解 为 ,“ 一 个 整数 和 值 ， 由 'y'、 
'e'、's' 所 代表 的 整数 值 按照 特定 编译 器 实现 中 定义 的 方式 组 合 得 到 ”"。 因 此 ， 这 两 
者 如 果 在 数值 上 有 什么 相似 之 处 ， 也 完全 是 一 种 巧合 而 已 。 
译注 : 在 Borland C++ v5.5 和 LCC v3.6 中 采取 的 做 法 是 ， 忽 略 多 余 的 字符 ， 最 
后 的 整数 值 即 第 一 个 字符 的 整数 值 ; 而 在 Visual C++ 6.0 和 GCC v2.95 中 采取 的 做 
法 是 ， 依 次 用 后 一 个 字符 覆盖 前 一 个 字符 ， 最 后 得 到 的 整数 值 即 最 后 一 个 字符 的 整 
数值 。 










练习 1-1， 某 些 C 编译 器 允许 嵌 套 注释 。 请 写 一 个 测试 程序 ， 要 求 : 无 论 是 
对 允许 嵌 套 注释 的 编译 器 ， 还 是 对 不 允许 嵌 套 注释 的 编译 器 ， 该 程序 都 能 正常 通 
过 编译 (无 错误 消息 出 现 )， 但 是 这 两 种 情况 下 程序 执行 的 结果 却 不 相同 。 

提示 : 被 双 括 号 括 起 的 字符 串 中 ， 注 释 符 /* 属于 字符 串 的 一 部 分 ， 而 在 注 
释 中 出 现 和 的 双 引 号 ”“ 又 属于 注释 的 一 部 分 。 
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练习 1-2。 如 果 由 你 来 实现 一 个 C 编译 器 ， 你 是 否 会 允许 嵌 套 注释 ? 如 果 你 
使 用 的 C 编译 器 允许 榜 套 注释 ,你 会 用 到 编译 器 的 这 一 特性 吗 ? 你 对 第 二 个 问题 
的 回答 是 否 会 影响 到 你 对 第 一 个 问题 的 回答 ? 


练习 1-3， 为 什么 n-->0 的 含义 是 n-- > 0， 而 不 是 n- -> 03 
练习 1-4， a+++++b 的 含义 是 什么 ? 





第 
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要 理解 一 个 C 程序 ， 仅 仅 理解 组 成 该 程序 的 符号 是 不 够 的 。 程 序 员 还 必须 理 
解 这 些 符号 是 如 何 组 合成 声明 、 表 达 式 、 语 句 和 程序 的 。 虽 然 这 些 组 合 方式 的 定 
义 都 很 完备 ， 几 乎 无 局 可 击 ， 但 有 时 这 些 定义 与 人 们 的 直觉 相悖 ， 或 者 容易 引起 
混淆 。 本 章 将 讨论 一 些 用 法 和 意义 与 我 们 想当然 的 认识 不 一 致 的 语法 结构 。 


2.1 理解 函数 声明 


有 一 次 ， 一 个 程序 员 与 我 交谈 一 个 问题 。 他 当时 正在 编写 一 个 独立 运行 于 某 
种 微 处 理 器 上 的 C 程序 。 当 计算 机 启动 时 , 硬件 将 调用 首 地 址 为 0 位 置 的 子 例 程 。 

为 了 模拟 开机 启动 时 的 情形 ， 我 们 必须 设计 出 一 个 C 语句 ， 以 显 式 调用 该 子 
例 程 。 经 过 一 段 时 间 的 思考 ， 我 们 最 后 得 到 的 语句 如 下 ; 

(* (voidQ(*)())0)1) 

像 这 样 的 表达 式 恐 怕 会 令 每 个 C 程序 员 的 内 心 都 “不 寒 而 栗 ”。 然 而 ， 他 们 
大 可 不 必 对 此 望 而 生 旦 ， 因 为 构造 这 类 表达 式 其 实 只 有 一 条 简单 的 规则 : 按照 使 
用 的 方式 来 声明 。 

任何 C 变量 的 声明 都 由 两 部 分 组 成 : 类 型 以 及 一 组 类 似 表达 式 的 声明 符 
(declarator)。 声 明 符 从 表面 上 看 与 简 斌 类 似 ， 对 它 求 值 应 该 返回 一 个 声明 
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中 给 定 类 型 的 结果 。 最 简单 的 声明 符 就 是 单个 变量 ， 如 ;: 

float f, g; 

这 个 声明 的 含义 是 : 当 对 其 求 值 时 , 表达 式 f 和 8g 的 类 型 为 浮 点 数 类 型 (float)。 
因为 声明 符 与 表达 式 的 相似 ， 所 以 我 们 也 可 以 在 声明 符 中 任意 使 用 括号 : 

float ((f) ) ; 

这 个 声明 的 含义 是 ， 当 对 其 求 值 时 ，(( 人 )) 的 类 型 为 浮 点 类 型 ， 由 此 可 以 推 知 ， 
f 也 是 浮 点 类 型 。 

同样 的 逻辑 也 适用 于 函数 和 指针 类 型 的 声明 ， 例 如 ， 

float ff(); 

这 个 声明 的 含义 是 : 表达 式 ff0) 求 值 结果 是 一 个 浮 点 数 ， 也 就 是 说 , 得 是 一 个 
返回 值 为 浮 点 类 型 的 函数 。 类 似 地 ， 

float *pf; 

这 个 声明 的 含义 是 *pf 是 一 个 浮 点 数 ， 也 就 是 说 ，pf 是 一 个 指向 浮 点 数 的 指 
针 。 

以 上 这 些 形式 在 声明 中 还 可 以 组 合 起 来 ， 就 像 在 表达 式 中 进行 组 合 一 样 。 因 
此 ， 

float x*g()，(xh) (); 
表示 *g(0) 与 (*h)O 是 浮 点 表达 式 。 因 为 0 结合 优先 级 高 于 *，*#gO 也 就 是 *(gO): g 是 
一 个 函数 ， 该 函数 的 返回 值 类 型 为 指向 浮 点 数 的 指针 。 同 理 ， 可 以 得 出 h 是 一 个 
函数 指针 ，h 所 指向 函数 的 返回 值 为 浮 点 类 型 。 

一 旦 我 们 知道 了 如 何 声 明 一 个 给 定 类 型 的 变量 ， 那 么 该 类 型 的 类 型 转换 符 就 
很 容易 得 到 了 : 只 需要 把 声明 中 的 变量 名 和 声明 末尾 的 分 号 去 掉 ， 再 将 剩余 的 部 
分 用 一 个 括号 整个 “封装 ”起 来 即 可 。 例 如 ， 因 为 下 面 的 声明 ; 

float (*h)(); 
表示 bh 是 一 个 指向 返回 值 为 浮 点 类 型 的 函数 的 指针 ， 因 此 ， 

(float (*)() ) 


表示 一 个 “指向 返回 值 为 浮 点 类 型 的 函数 的 指针 ”的 类 型 转换 符 。 
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拥有 了 这 些 预 备 知识 ， 我 们 现在 可 以 分 两 步 来 分 析 表 达 式 (*(void(*)0)0)0) 。 

第 一 步 ， 假 定 变量 印 是 一 个 函数 指针 ， 那 么 如 何 调用 fp 所 指向 的 通 数 呢 ? 
调用 方法 如 下 : 

(*fp) () ; 四 

因为 印 是 一 个 函数 指针 ， 那 么 *fp 就 是 该 指针 所 指向 的 函数 ， 所 以 (*fp)0 就 
是 调用 该 函数 的 方式 。ANSIC 标准 允许 程序 员 将 上 式 简写 为 fp(), 但 是 一 定 要 记 
住 这 种 写法 只 是 一 种 简写 形式 。 

在 表达 式 (*fp)0 中 ，*fp 两 侧 的 括号 非常 重要 ， 因 为 函数 运算 符 0 的 优先 级 高 
于 单 目 运算 符 *。 如 果 *fp 两 侧 没 有 括号 ， 那 么 tfpO 实 际 上 与 *fpO) 的 含义 完全 一 
致 ，ANSIC 把 它 作为 *((*fp)O) 的 简写 形式 。 

现在 ， 剩 下 的 问题 就 只 是 找到 一 个 恰当 的 表达 式 来 替换 fp。 我 们 将 在 分 析 的 
第 二 步 来 解决 这 个 问题 。 如 果 C 编译 器 能 够 理解 我 们 大 脑 中 对 于 类 型 的 认识 ， 那 
么 我 们 可 以 这 样 写 : 

(x0)() 

上 式 并 不 能 生效 ， 因 为 运算 符 * 必 须要 一 个 指针 来 做 操作 数 。 而 且 ， 这 个 指针 
还 应 该 是 一 个 图 数 指针 , 这样 经 运算 符 * 作 用 后 的 结果 才能 作为 函数 被 调用 。 因 此 ， 
在 上 式 中 必须 对 0 作 类 型 转换 ， 转 换 后 的 类 型 可 以 大 致 描述 为 :“ 指 向 返回 值 为 
void 类 型 的 函数 的 指针 ” 

如 果 印 是 一 个 指向 返回 值 为 void 类 型 的 函数 的 指针 , 那么 (*fp)O 的 值 为 void， 
和 的 声明 如 下 : 

void (*fp})(}); 

因此 ， 我 们 可 以 用 下 式 来 完成 调用 存储 位 置 为 0 的 子 例 程 : 

void {(*fp) (); 

(*fp){) 
译注 : 此 处 作者 很 设 印 默认 初始 化 为 0， 这 种 写法 不 宜 提 倡 。 
这 种 写法 的 代价 是 多 声明 了 一 个 “ 哑 ” 变 量 。 

但 是 ， 我 们 一 旦 知道 如 何 声 明 一 个 变量 ， 也 就 自然 知道 如 何 对 一 个 常数 进行 
类 型 转换 ， 将 其 转型 为 该 变量 的 类 型 ， 只 需要 在 变量 声明 中 将 变量 名 去 掉 即 可 。 
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因此 ， 将 常数 0 转型 为 “指向 返回 值 为 void 的 函数 的 指针 ”类 型 ， 可 以 这 样 写 : 

(void {*){))0 

因此 ， 我 们 可 以 用 (void (*)0)0 来 替换 印 ， 从 而 得 到 ;: 

(* (void (*)())0) 0) 

末尾 的 分 号 使 得 表达 式 成 为 一 个 语句 。 

在 我 当初 解决 这 个 问题 的 时 候 ，C 语言 中 还 没有 typedef 声明 。 尽 管 不 用 
typedef 来 解决 这 个 问题 对 剖析 本 例 的 细节 而 言 是 一 个 很 好 的 方式 ， 但 无 疑 使 用 
typedef 能 够 使 表述 更 加 清 蜥 ， 


typedef void (*funcptr)(}); 
(*{funcptr})0)(); 


这 个 棘手 的 例子 并 不 是 孤立 的 ， 还 有 一 些 C 程序 员 经 常 遇 到 的 问题 ， 实 际 上 
和 这 个 例子 是 同一 个 类 型 的 。 例 如 ， 考 虑 signal 库 函 数 ， 在 包括 该 函数 的 C 编译 
器 实现 中 ，signal 函数 接受 两 个 参数 : 一 个 是 代表 需要 “被 捕获 ”的 特定 signal 
的 整数 值 ， 另 一 个 是 指向 用 户 提供 的 函数 的 指针 ， 该 函数 用 于 处 理 “ 捕 获 到 ”的 
特定 signal， 返 回 值 类 型 为 void。 我 们 将 会 在 本 书 5.5 节 详 细 讨 论 该 函数 。 

一 般 情 况 下 ， 程 序 员 并 不 主动 声明 signal 函数 ， 而 是 直接 使 用 系统 头 文件 
signal.h 中 的 声明 。 那 么 ， 在 头 文件 signal.h 中 ，signal 函数 是 如 何 声明 的 呢 ? 

首先 ,让 我 们 从 用 户 定义 的 信号 处 理 函 数 开始 考 起 , 这 无 疑 是 最 容易 解决 的 。 
该 函数 可 以 定义 如 下 : 


void sigfuncl{(int n)t 


/* 特定 信号 处 理 部 分 */ 


前 数 sigfunc 的 参数 是 一 个 代表 特定 信和 号 的 整数 值 ， 此 处 我 们 暂时 忽略 它 。 
上 面 假设 的 函数 体 定义 了 sigfunc 函数 ， 因 而 sigfunc 函数 的 声明 可 以 如 下 ， 


void sigfunc(int ); 


现在 假定 我 们 希望 声明 一 个 指向 sigfunc 函数 的 指针 变量 ， 不 妨 命名 为 sfp。 
因为 sfp 指向 sigfunc 函数 ， 则 *sfp 就 代表 了 sigfunc 函数 ， 因 此 *sfp 可 以 被 调用 。 
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又 假定 sig 是 一 个 整数 , 则 (*sfp)(sig) 的 值 为 void 类 型 ,因此 我 们 可 以 如 下 声明 sfp: 

void (*sfp) (int); 

因为 signal 函数 的 返回 值 类 型 与 sfp 的 返回 类 型 一 样 ， 上 式 也 就 声明 了 signal 
函数 ， 我 们 可 以 如 下 声明 signal 函数 ， 

void (*signal (something)) (int)}; 

此 处 的 something 代表 了 signal 函数 的 参数 类 型 ， 我 们 还 需要 进一步 了 解 如 
何 声明 它们 。 上 面 声明 可 以 这 样 理解 ; 传递 适当 的 参数 以 调用 signal 函数 ,对 signal 
函数 返回 值 〈 为 函数 指针 类 型 ) 解除 引用 (dereference)， 然 后 传递 一 个 整 型 参数 
调用 解除 引用 后 所 得 函数 ， 最 后 返回 值 为 void 类 型 。 因 此 ，signal 函数 的 返回 值 
是 一 个 指向 返回 值 为 void 类 型 的 函数 的 指针 。 

那么 ，signal 函数 的 参数 又 是 如 何 昵 ? signal 函数 接受 两 个 参数 : 一 个 整 型 的 
信号 编号 ， 以 及 一 个 指向 用 户 定义 的 信号 处 理 函 数 的 指针 。 我 们 此 前 已 经 定义 了 
指向 用 户 定义 的 信号 处 理 函 数 的 指针 sfp: 

void (*sfp}) (int}; 

sfp 的 类 型 可 以 通过 将 上 面 的 声明 中 的 sfp 去 掉 而 得 到 ， 即 void (*)(int)。 此 
外 ，signal 函数 的 返回 值 是 一 个 指向 调用 前 的 用 户 定 义 信 号 处 理 函 数 的 指针 ， 这 
个 指针 的 类 型 与 sfp 指针 类 型 一 致 。 因 此 ， 我 们 可 以 如 下 声明 signal 函数 ; 

void (*signal (int, void(*) (int)})})) (int); 

同样 地 ， 使 用 typedef 可 以 简化 上 面 的 函数 声明 ; 

typedef void (*HANDLER) (int); 


HANDLER signal (int, HANDLER); 


运算 符 的 优先 级 问题 


假设 存在 一 个 己 定 义 的 常量 FLAG，FLAG 是 一 个 整数 ， 且 该 整数 值 的 二 进 
制 表示 中 只 有 某 一 位 是 1， 其余 各 位 均 为 0， 亦 即 该 整数 是 2 的 某 次 宕 。 如 果 对 于 
整 型 变量 flags， 我 们 需要 判断 它 在 常量 FLAG 为 1 的 那 一 位 上 是 否 同 样 也 为 1， 
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通常 可 以 这 样 写 ; 

if (flags & FLAG) ... 

上 式 的 含义 对 大 多 数 C 程序 员 来 说 是 显而易见 的 : 这 语句 判断 括号 内 表达 式 
的 值 是 否 为 0。 考 虑 到 可 读 性 ， 如 果 对 表达 式 的 值 是 否 为 0 的 判断 能 够 显 式 地 加 
以 说 明 ， 无 疑 使 得 代码 自身 就 起 到 了 注释 该 段 代 码 意图 的 作用 。 其 写法 如 下 ， 

if (flags & FLAG != 0) .. 

这 个 语句 现在 虽然 更 好 懂 了 ， 但 却 是 一 个 错误 的 语句 。 因 为 != 运 算 符 的 优先 
级 要 高 于 & 运算 符 ， 所 以 上 式 实际 上 被 解释 为 : 

if (flags & (FLRG != 0) ) .. 

因此 , 除了 FLAG 恰好 为 1 的 情形 , FLAG 为 其 他 数 时 这 个 式 子 都 是 错误 的 。 

又 假设 hi 和 low 是 两 个 整数 ， 它 们 的 值 介 于 0 到 15 之 间 ， 如 果 r 是 一 个 8 
位 整数 ， 且 的 低 4 位 与 low 各 位 上 的 数 一 致 ， 而 r 的 高 4 位 与 hi 各 位 上 的 数 一 
致 。 很 自然 会 想到 要 这 样 写 : 

r = hi<<4 + low; 

但 是 很 不 幸 , 这 样 写 是 错误 的 。 加 法 运算 的 优先 级 要 比 移 位 运算 的 优先 级 高 ， 
因此 本 例 实 际 上 相当 于 : 

r = hi<< (4 + low); 

对 于 这 种 情况 ， 有 两 种 更 正方 法 : 第 一 种 方法 是 加 括号 ， 第 二 种 方法 意识 到 
问题 出 在 程序 员 混淆 了 算术 运算 与 远 辑 运算 ， 但 这 种 方法 牵涉 到 的 移 位 运算 与 逻 
辑 运 算 的 相对 优先 级 就 更 加 不 是 那么 明显 。 两 种 方法 如 下 : 

r= (hi<<4) + low; // 法 1: 加 括号 

r = hi<<4 | low; // 法 2: 将 原来 的 加 号 改 为 按 位 逻辑 或 


用 添加 括号 的 方法 虽然 可 以 完全 避免 这 类 问题 ， 但 是 表达 式 中 有 了 太 多 的 括 
号 反而 不 容易 理解 。 因 此 ， 记 住 C 语言 中 运算 符 的 优先 级 是 有 益 的 。 


遗憾 的 是 ， 运 算 符 优先 级 有 15 个 之 多 ， 因 此 记 住 它们 并 不 是 一 件 容易 的 事 。 
完整 的 C 语言 运算 符 优先 级 表 如 表 2-1 所 示 : 
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表 2-1 C 语言 运算 符 优先 级 表 “由 上 至 下 ， 优 先 级 依次 递减 ) 


一 -一 
运 算 符 结 合 性 
自 左 向 右 


0 [0 -> ， 
! ~ ++ -- - {type) * & sizeof 自 右 至 左 
* 1 % 自 左 向 右 


+ - 自 左 向 右 
es 


<< >> 自 左 向 右 
< <= > >= ] 自 左 向 右 


















































== 1= 自 左 向 右 
及 自 左 向 右 
^ 自 左 向 右 
| 自 左 向 右 
&& 自 左 向 右 
1 自 左 向 右 
2: 自 右 至 左 
assignments 自 右 至 左 

自 左 向 右 


如 果 把 这 些 运算 符 恰当 分 组 ， 并 且 理 解 了 各 组 运算 符 之 间 的 相对 优先 级 ， 那 
么 这 张 表 其 实 不 难 记 住 。 

优先 级 最 高 者 其 实 并 不 是 真正 意义 上 的 运算 符 ， 包 括 ， 数组 下 标 、 郊 数 调用 
操作 符 各 结构 成 员 选择 操作 符 。 它 们 都 是 自 左 于 右 结合 ， 因 此 a.b.c 的 含义 是 
(a.b).c， 而 不 是 a.(b.c)。 

单 目 运 算 符 的 优先 级 仅 次 于 前 述 运 算 符 。 在 所 有 的 真正 意义 上 的 运算 符 中 ， 
它们 的 优先 级 最 高 。 因 为 函数 调用 的 优先 级 要 高 于 单 目 运 算 符 的 优先 级 ， 所 以 如 
果 p 是 一 个 函数 指针 , 要 调用 p 所 指向 的 函数 , 必须 这 样 写 : (*p)()。 如 果 写 成 *p0， 
编译 器 会 解释 成 *(p())。 类 型 转换 也 是 单 目 运算 符 , 它 的 优先 级 和 其 他 单 目 运 算 符 
的 优先 级 一 样 。 单 目 运 算 符 是 自 右 至 左 结合 , 因此 *p++ 会 被 编译 器 解释 成 *(p++)， 
即 取 指针 p 所 指向 的 对 象 ， 然 后 将 p 递增 1， 而 不 是 (*p)++， 即 取 指针 p 所 指向 
的 对 象 ， 然 后 将 该 对 象 递增 1。 本 书 3.7 节 还 进一步 指出 了 p++ 的 含义 有 时 会 出 人 
意料 。 

优先 级 比 单 目 运算 符 要 低 的 ， 接 下 来 就 是 双 目 运算 符 。 在 双 目 运算 符 中 ， 算 
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术 运 算 符 的 优先 级 最 高 ， 移 位 运算 符 次 之 ， 关 系 运算 符 再 次 之 ， 接 着 是 逻辑 运算 
符 ， 赋 值 运算 符 ， 最 后 是 条 件 运 算 符 。 
译注 ， 原 书 如 此 ， 条 件 运 算 符 实 际 应 为 三 目 运算 符 。 

我 们 需要 记 住 的 最 重要 的 两 点 是 : 

1， 任何 一 个 逻辑 运算 符 的 优先 级 低 于 任何 一 个 关系 运算 符 。 

2， 移 位 运算 符 的 优先 级 比 算术 运算 符 要 低 ， 但 是 比 关 系 运算 符 要 高 。 

属于 同一 类 型 的 各 个 运算 符 之 间 的 相对 优先 级 , 理解 起 来 一 般 没有 什么 困难 。 
乘法 、 除 法 和 求 余 优先 级 相同 ， 加 法 、 减 法 的 优先 级 相同 ， 两 个 移 位 运算 符 的 优 
先 级 也 相同 。1/2*a 的 含义 是 (1/2)*a, 而 不 是 1(2*a), 这 一 点 也 许 会 让 某 些 人 吃 恢 ， 
其 实在 这 方面 C 语言 与 Fortran 语言 Pascal 语言 以 及 其 他 程序 设计 语言 之 间 的 行 
为 表现 并 无 差别 。 

但 是 ，6 个 关系 运算 符 的 优先 级 并 不 相同 ， 这 一 点 或 许 让 人 感到 有 些 吃 惊 。 
运算 符 == 和 != 的 优先 级 要 低 于 其 他 关系 运算 符 的 优先 级 。 因 此 ， 如 果 我 们 要 比较 
a 与 b 的 相对 大 小 顺序 是 否 和 ¢ 与 d 的 相对 大 小 顺序 一 样 ， 就 可 以 这 样 写 : 





a<b==c<d 

任何 两 个 逻辑 运算 符 都 具有 不 同 的 优先 级 。 所 有 的 按 位 运算 符 优 先 级 要 比 顺 
序 运算 符 的 优先 级 高 ， 每 个 “与 ”运算 符 要 比 相应 的 “或 ”运算 符 优先 级 高 ， 而 
按 位 异 或 运算 符 〈^ 运 算 符 ) 的 优先 级 介 于 按 位 与 运算 符 和 按 位 或 运算 符 之 间 。 

这 些 运算 符 的 优先 顺序 是 由 于 历史 原因 形成 的 。B 语言 是 C 语言 的 “祖先 ”， 
B 语言 中 的 逻辑 运算 符 大 致 相当 于 C 语言 中 的 & 和 | 运算 符 。 虽 然 这 些 运算 符 从 
定义 上 而 言 是 按 位 操作 的 ， 但 是 当 它们 出 现在 条 件 语句 的 上 下 文中 时 ，B 语言 的 
编译 器 会 将 它们 作为 相当 于 现在 C 语言 中 的 && 和 1 运算 符 处 理 。 而 到 了 C 语言 
中 ， 这 两 种 不 同 的 用 法 被 区 分 开 来 ， 从 兼容 性 的 角度 来 考虑 ， 如 果 对 它们 优先 顺 
序 的 改变 过 大 将 是 一 件 危险 的 事 。 

在 本 节 到 现在 为 止 提 及 的 所 有 运算 符 中 ， 三 目 条 件 运算 符 优先 级 最 低 。 这 就 
允许 我 们 在 三 目 条 件 运算 符 的 条 件 表达 式 中 包括 关系 运算 符 的 逻辑 组 合 ， 例 如 : 


tax_rate = income>40000 && residency<5 ? 3.5; 2.0; 


本 例 其 实 还 揭示 了 : 赋值 运算 符 的 优先 级 低 于 条 件 运算 符 的 优先 级 是 有 意义 
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的 。 此 外 ， 所 有 的 赋值 运算 符 的 优先 级 是 一 样 的 ， 而 且 它们 的 结合 方式 是 从 右 到 
左 ， 因 此 ， 


home_score = visitor, score = 0; 
与 下 面 两 条 语句 所 表达 的 意思 是 相同 的 ; 


visitor_score = 0) 


home_score = visitor_score; 


在 所 有 的 运算 符 中 ,逗号 运算 符 的 优先 级 最 低 。 这 一 点 很 容易 记 住 ， 因 为 去 
号 运算 符 常 用 于 在 需要 一 个 表达 式 而 不 是 一 条 语句 的 情形 下 替换 作为 语句 结束 标 
志 的 分 号 。 喜 号 运算 符 在 宏 定义 中 特别 有 用 ， 这 一 点 在 本 书 的 6.3 节 还 会 进一步 
讨论 。 
在 涉及 到 赋值 运算 符 时 ， 经 常会 引起 优先 级 的 混淆 。 考 虑 下 面 的 这 个 例子 ， 
例子 中 循环 语句 的 本 意 是 复制 一 个 文件 到 另 一 个 文件 : 
while {c=getcl(in) != EOF) 
putcl(c,out); 
在 while 诸 句 的 表达 式 中 ，c 似乎 是 首先 被 赋予 函数 getc(in) 的 返回 值 ， 然 后 
与 EOF 比较 是 否 到 达 文 件 结尾 以 便 决定 是 否 终止 循环 。 然而 ,由 于 赋值 运算 符 的 
优先 级 要 低 于 任何 一 个 比较 运算 符 , 因此 c 的 值 实际 上 是 消 数 getc(in) 的 返回 值 与 
EOF 比较 的 结果 。 此 处 函数 getc(in) 的 返回 值 只 是 一 个 临时 变量 ， 在 与 EOF 比较 
后 就 被 “丢弃 ”了 。 因 此 ， 最 后 得 到 的 文件 “副本 ”中 只 包括 了 一 组 二 进 制 值 为 
1 的 字 节 流 。 
上 例 实际 应 该 写成 : 
while ((Cc=getc(in)) != EOF) 
putc{c,out); 
如 果 表 达 式 再 复杂 一 点 ， 这 类 错误 就 很 难 被 察觉 。 例 如 ， 本 书 第 4 章 章 首 提 
及 的 lint 程序 的 一 个 版 本 ， 在 发 布 时 包括 了 下 面 一 行 错误 代码 : 


ift( (t=BTYPE(pt1l->aty)==STRTY) || t==UNIONTY){ 


这 行 代码 本 意 是 首先 赋值 给 t, 然后 判断 4 是否 等 于 STRTY 或 者 UNIONTY。 
实际 的 结果 却 大 相 径 庭 : 根据 BTYPE(pt1->aty) 的 值 是 否 等 于 STRTY, t 的 取 值 或 
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者 为 1 或 者 为 0， 如 果 t 取 值 为 0， 还 将 进一步 与 UNIONTY 比较 。 


2.3 ”注意 作为 语句 结束 标志 的 分 号 


在 C 程序 中 如 果 不 小 心 多 写 了 一 个 分 号 可 能 不 会 造成 什么 不 良 后 果 : 这 个 分 
号 也 许 会 被 视 作 一 个 不 会 产生 任何 实际 效果 的 空 语句 ， 或 者 编译 器 会 因为 这 个 多 
余 的 分 号 而 产生 一 条 警告 信息 ， 根 据 警告 信息 的 提示 能 够 很 容易 去 掉 这 个 分 号 。 
一 个 重要 的 例外 情形 是 在 让 或 者 while 语句 之 后 需要 紧 跟 一 条 语句 时 ， 如 果 此 时 
多 了 一 个 分 号 ， 那 么 原来 紧 跟 在 if 或 者 while 子 句 之 后 的 语句 就 是 一 条 单独 的 语 
句 ， 与 条 件 判 断 部 分 没有 了 任何 关系 。 考 虑 下 面 的 这 个 例子 : 
if (x{[i] > big); 
big = xf[i]:; 
编译 器 会 正常 地 接受 第 一 行 代码 中 的 分 号 而 不 会 提示 任何 警告 信息 ， 因 此 纺 
译 器 对 这 段 程序 代码 的 处 理 与 对 下 面 这 段 代码 的 处 理 就 大 不 相同 : 
if (x[i] > big) 
big = x[il; 
前 面 第 一 个 例子 〈 即 在 让 后 多 加 了 一 个 分 号 的 例子 》 实际 上 相当 于 
if (xfil > big) { } 
big = x[il; 


当然 ， 也 就 等 同 于 〈 除 非 x、I 或 者 big 是 有 副作用 的 宏 》 


big = x[il; 
如 果 不 是 多 写 了 一 个 分 号 ， 而 是 遗漏 了 一 个 分 号 ， 同 样 会 招致 麻烦 。 例 如 : 
if {n<3) 
return 


logrec.date = x[0]; 
logrec.time = x[1]; 
logrec.code = x[2]; 


此 处 的 return 语句 后 面 遗漏 了 一 个 分 号 ;然而 这 段 程序 代码 仍然 会 顺利 通过 


24 


第 2 章 语法 “陷阱 ” 





编译 而 不 会 报错 ， 只 是 将 语句 

logrec .date = x[0]; 
当 作 了 retum 语句 的 操作 数 。 上 面 这 段 程序 代码 实际 上 相当 于 : 

if (n<3)} 

return logrec.date = x[0]; 

logrec.time = x[1]; 

logrec.code = x[2]; 

如 果 这 段 代 码 所 在 的 函数 声明 其 返回 值 为 void， 编 译 器 会 因为 实际 返回 值 的 
类 型 与 声明 返回 值 的 类 型 不 一 致 而 报错 。 然 而 ， 如 果 一 个 函数 不 需要 返回 值 ( 即 
返回 值 为 void)， 我 们 经 常 在 函数 声明 时 省 略 了 返回 值 类 型 ， 但 是 此 时 对 编译 器 
言 会 隐 含 地 将 函数 返回 值 类 型 视 作 int 类 型 。 如 果 是 这 样 ， 上 面 的 错误 就 不 会 
被 编译 器 检测 到 。 在 上 面 的 例子 中 ， 当 n>=3 时 ， 第 一 个 赋值 语句 会 被 直接 跳 过 ， 
由 此 造成 的 错误 可 能 会 是 一 个 潜伏 很 深 、 极 难 发 现 的 程序 Bug。 


还 有 一 种 情形 ， 也 是 有 分 号 与 没 分 号 的 实际 效果 相差 极为 不 同 。 那 就 是 当 一 
个 声明 的 结尾 紧 跟 一 个 函数 定义 时 ， 如 果 声 明 结 尾 的 分 号 被 省 略 ， 编 译 器 可 能 会 
把 声明 的 类 型 视 作 函 数 的 返回 值 类 型 。 考 虑 下 面 的 例子 : 

struct logrect{ 

int date; 
int time; 


int code; 


main{()} 


在 第 一 个 } 与 紧 随 其 后 的 函数 main 定义 之 间 ， 遗 漏 了 一 个 分 号 。 因 此 ， 上 面 
代码 段 实际 的 效果 是 声明 函数 main 的 返回 值 是 结构 logrec 类 型 。 写 成 下 面 这 样 ， 
会 看 得 更 清楚 : 

struct logrect 

int date; 


int time; 
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int code; 


如 果 分 号 没有 被 省 赂 ， 函 数 main 的 返回 值 类 型 会 缺 省 定义 为 int 类 型 。 

在 函数 main 中 ,如 果 本 应 返回 一 个 int 类 型 数值 , 却 声明 返回 一 个 struct iogrec 
类 型 的 结构 ， 会 产生 怎样 的 效果 呢 ? 我 们 把 它 留 作为 本 章 结尾 的 一 个 练习 。 虽 然 
刻意 地 往 消 极 面 去 联想 也 许 有 些 “ 病 态 ” 但 对 要 考虑 到 各 种 意外 情形 的 程序 设计 
(比如 航空 航天 或 医疗 仪器 的 控制 程序 )， 却 是 不 无 神 益 的 。 


2.4 _ switch 语句 


C 语言 的 switch 诸 句 的 控制 流程 能 够 依次 通过 并 执行 各 个 case 部 分 , 这 一 点 
是 C 语言 与 众 不 同 之 处 。 考 虑 下 面 的 例子 ， 两 段 程序 代码 分 别 用 C 语言 和 Pascal 
语言 编写 : 
switch(color}{ 
case 1: printf (“red’”); 
break; 
case 2: printf (“yellow”)}; 
break; 
case 3: printf{“blue”"); 
break; 
} 


Case color of 


1 write(l’‘red’); 
2 write(’‘yellow’); 
3 write(’‘blue'’); 
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end 

两 段 程序 代码 要 完成 的 是 同样 的 任务 : 根据 变量 color 的 值 (1，2 或 3)， 分 
别 打印 出 red，yellow 或 blue。 两 段 程序 代码 非常 相似 ， 只 有 一 个 例外 情形 : 那 就 
是 用 .Pascal 语言 编写 的 程序 段 中 每 个 case 部 分 并 没有 与 C 语言 的 break 诸 句 对 应 
的 部 分 。 之 所 以 会 这 样 ， 原 因 在 于 C 语言 中 把 case 标号 当 作 真正 意义 上 的 标号 ， 
因此 程序 的 控制 流程 会 径直 通过 case 标号 ， 而 不 会 受到 任何 影响 。 而 另 一 方面 ， 
在 Pascal 语言 中 每 个 case 标号 都 隐 含 地 结束 了 前 一 个 case 部 分 。 

让 我 们 从 另 一 个 角度 来 看 待 这 个 问题 , 假设 将 前 面 用 C 语言 编写 的 程序 代码 
段 稍 作 改 动 ， 使 其 在 形式 上 与 用 Pascal 语言 编号 的 代码 段 类 似 : 

Switch (color) { 

case 1l:printf (“red’”); 

case 2:printf (“yellow”"),; 

case 3:printf ("blue”"); 

} 
又 进一步 假定 变量 color 的 值 为 2。 最 后 ， 程 序 将 会 打印 出 

yellowblue 
因为 程序 的 控制 流程 在 执行 了 第 二 个 printf 函数 的 调用 之 后 ， 会 自然 而 然 地 顺序 
执行 下 去 ， 第 三 个 printf 函数 调用 也 会 被 执行 。 

C 语言 中 switch 语句 的 这 种 特性 ， 既 是 它 的 优势 所 在 ， 也 是 它 的 一 大 弱点 。 
说 它 是 一 大 弱点 ， 是 因为 程序 员 很 容易 就 会 遗漏 各 个 case 部 分 的 break 语句 ， 造 
成 一 些 难以 理解 的 程序 行为 。 说 它 是 优势 所 在 ， 是 因为 如 果 程 序 员 有 意 略 去 一 个 
break 语句 ， 则 可 以 表达 出 一 些 采 用 其 他 方式 很 难 方便 地 加 以 实现 的 程序 控制 结 
构 。 特别 是 对 于 一 些 大 的 switch 语句 , 我 们 常常 会 发 现 各 个 分 支 的 处 理 大 同 小 异 : 
对 某 个 分 支 情况 的 处 理 只 要 稍 作 改 动 ， 剩 余部 分 就 完全 等 同 于 另 一 个 分 支 情况 下 
的 处 理 。 


例如 , 考虑 这 样 一 个 程序 , 它 是 某 种 假想 的 计算 机 的 解释 器 (相当 于 虚拟 机 )。 
这 个 程序 中 包含 有 一 个 switch 语句 ， 用 来 处 理 每 个 不 同 的 操作 码 。 在 这 种 假想 的 
计算 机 上 ， 只 要 将 第 二 个 操作 数 的 正 负 号 反 号 后 ， 减 法 运算 和 加 法 运算 的 处 理 本 
质 上 就 是 一 样 的 。 因 此 ， 如 果 我 们 可 以 像 下 面 这 样 写 代码 ， 无 疑 会 大 大 方便 程序 
的 处 理 : 
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Case SUBTRACT: 
opnd2 = -opnd2; 
/* 此 处 没有 break 语句 */ 


case ADD: 


当然 ， 像 上 面 的 例子 那样 添加 适当 的 程序 注释 是 一 个 不 错 的 做 法 。 当 其 他 人 
阅读 到 这 段 代 码 时 ， 就 能 够 了 解 到 此 处 是 有 意 省 去 了 一 个 break 语句 。 
再 看 男 一 个 例子 ， 考 虑 这 样 一 段 代码 ， 它 的 作用 是 一 个 编译 器 在 查找 符号 时 
跳 过 程序 中 的 空白 字符 。 这 里 ， 空 格 键 、 制 表 符 和 换行 符 的 处 理 都 是 相同 的 ， 除 
了 当 遇 到 换行 符 时 程序 的 代码 行 计数 器 需要 进行 递增 ; 
Case ‘\n’: 
linecount++; 
/* 此 处 没有 break 语句 */ 
case ‘\t’;: 


Case * ‘: 


2.5 ”函数 调用 


与 其 他 程序 设计 语言 不 同 ，C 语言 要 求 ， 在 函数 调用 时 即使 函数 不 带 参数 ， 
也 应 该 包括 参数 列表 。 因 此 ， 如 果 f 是 一 个 函数 ， 

£(); 
是 一 个 函数 调用 语句 ， 而 

fl; 
却 是 一 个 什么 也 不 做 的 语句 。 更 精确 地 说 ， 这 个 语句 计算 函数 f 的 地 址 ， 却 并 不 
调用 该 函数 。 
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2.6 “悬挂 ”else 引发 的 问题 


这 个 问题 虽然 已 经 为 人 熟知 ， 而 且 也 并 非 C 语言 所 独 有 ， 但 即使 是 有 多 年 经 
验 的 C 程序 员 也 常常 在 此 失误 过 。 


考虑 下 面 的 程序 片段 : 
if (x == 0) 

if (ly == 0) error() 
elsel 

ZzZ=X+Yy; 

f(&2z); 


这 有 段 代码 中 编程 者 的 本 意 是 应 该 有 两 种 主要 情况 ，x 等 于 0 以 及 x 不 等 于 0。 
对 于 x 等 于 0 的 情形 ， 除 非 y 也 等 于 0( 此 时 调用 函数 error )， 否 则 程序 不 作 任 
何 处 理 ， 对 于 x 不 等 于 0 的 情形 ， 程 序 首 先 将 x 与 y 之 和 赋值 给 z， 然 后 以 z 的 
地 址 为 参数 来 调用 函数 f。 


然而 ， 这 段 代码 实际 上 所 做 的 却 与 编程 者 的 意图 相去 其 远 。 原 因 在 于 C 语言 
中 有 这 样 的 规则 ，else 始终 与 同一 对 括号 内 最 近 的 未 匹配 的 计 结 合 。 如 果 我 们 按 
照 上 面 这 段 程序 实际 上 被 执行 的 逻辑 来 调整 代码 缩 进 ， 大 致 是 这 个 样子 
if (x == 0) { 
if {y == 0) 
error(); 
else { 
Z=X+Y; 
f(&2); 
} 
} 


也 就 是 说 ， 如 果 x 不 等 于 0， 程 序 将 不 会 做 任何 处 理 。 如 果 要 得 到 原来 的 例 
子 中 由 代码 缩 进 体现 的 编程 者 本 意 的 结果 ， 应 该 这 样 写 ; 
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if (x == 0) { 
if {y == 0) 
error(); 


} else { 


现在 ，else 与 第 一 个 过 结合 ， 即 使 它 离 第 二 个 二 更 近 也 是 如 此 ， 因 为 此 时 第 
二 个 站 已 经 被 括号 “封装 ”起 来 了 。 

有 的 程序 设计 语言 在 站 语 句 中 使 用 收尾 定 界 符 来 显 式 地 说 明 ,。 例如 , 在 Algol 
68 语言 中 ， 前 面 提 到 的 例子 可 以 这 样 写 ; 


by 0 
then if WE 
then error 
£1i 
else Z := XxX + YY} 
f(z) 
£i 
像 上 面 这 样 强制 使 用 收尾 定 界 符 完全 避免 了 “悬挂 ”else 的 问题 ， 付 出 的 代 
价 则 是 程序 稍稍 变 长 了 一 点 .有些 C 程序 员 通 过 使 用 宏 定 义 也 能 达到 类 似 的 效果 ; 


#define IF {ift 

#define THEN 3 

#define ELSE } else { 
#define FI }} 

这 样 ， 上 例 中 的 C 程序 就 可 以 写成 : 
IE x == 0 


‘THEN IF Y == 0 
THEN errort{); 


FI 
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如 果 一 个 C 程序 员 过 去 不 是 长 期 浸 淫 于 Algol 68 语言 ,他 会 发 现 上 和 面 这 段 代 
码 难 于 卒 读 。 这 样 一 种 解决 方案 所 带 来 的 问题 可 能 比 它 所 解决 的 问题 偿 要 更 糟糕 。 
练习 2-1. C 语言 允许 初始 化 列表 中 出 现 多 余 的 逗号 ， 例 如 ; 


int days[] = { 31, 28, 31, 30, 31, 30, 
31, 31, 30, 31, 30, 31,); 
为 什么 这 种 特性 是 有 用 的 ? 


练习 2-2。 本 章 的 第 3 节 指出 了 在 C 语言 中 以 分 号 作为 语句 结束 的 标志 而 带 
来 的 一 些 问题 。 虽 然 我 们 现在 考虑 改变 C 语言 的 这 个 规定 已 经 太 迟 ， 但 是 设想 一 
下 分 隔 语句 是 否 还 有 其 他 办 法 却 是 一 件 锁 有 趣味 的 事情 。 其 他 语言 中 是 如 何 分 隅 
诸 句 呢 ? 这 些 方法 是 否 也 存在 它们 固有 的 缺陷 呢 ? 
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一 个 句子 哪怕 其 中 的 每 个 单词 都 拼写 正确 , 而 且 语 法 也 无 懈 可 击 , 仍然 可 能 有 
歧义 或 者 并 非 书 写 者 希望 表达 的 意思 。 程序 也 有 可 能 表面 看 上 去 是 一 个 意思 ， 而 实 
际 上 的 意思 却 相去 其 远 。 本 章 考察 了 若干 种 可 能 引起 上 述 歧 义 的 程序 书写 方式 。 

这 一 章 中 还 讨论 了 这 样 的 情形 ， 如 果 只 是 肤浅 地 考察 ， 一 切 都 “显得 ” 合 情 
合理 ， 而 事实 上 这 种 情况 在 所 有 的 C 语言 实现 中 给 出 的 结果 却 都 是 未 定义 的 。 在 
某 些 C 语 言 实现 中 能 够 正常 工作 , 而 在 另 一 些 C 语 言 实现 中 却 又 不 能 工作 的 情形 ， 
这 属于 可 移植 性 方面 的 问题 ， 将 在 第 7 章 中 给 予 论述 。 


3.1 指针 与 数组 


C 语言 中 指针 与 数组 这 两 个 概念 之 间 的 联系 是 如 此 密 不 可 分 ， 以 至 于 如 果 不 
理解 一 个 概念 ， 就 无 法 彻底 理解 另 一 个 概念 。 而 且 ，C 语言 对 这 些 概念 的 处 理 ， 
在 某 些 方面 与 其 他 任何 为 人 熟知 的 程序 语言 都 有 所 不 同 。 

C 语 过 中 的 数组 值得 注意 的 地 方 有 以 下 两 点 ; 

1. C 语言 中 只 有 一 维 数组 ， 而 且 数组 的 大 小 必须 在 编译 期 就 作为 一 个 常数 确 
定 下 来 。 然 而 ，C 语言 中 数组 的 元 素 可 以 是 任何 类 型 的 对 象 ， 当 然 也 可 以 是 另外 
一 个 数组 。 这 样 ， 要 “仿真 ”出 一 由 索 绯 歼 盘 起 不 是 一 件 难事 。 
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译注 : C99 标准 允许 变 长 数组 (VLA ) 。GCC 编译 器 中 实现 了 变 长 数组 ， 但 细 
节 与 C99 标准 不 完全 一 致 . 感 兴趣 的 读者 可 参看 ISO/TIEC 9899:1999 标准 6.7.5.2 节 ， 
以 及 Dennis M. Ritchie 的 Variable-Size Arrays in C. 


2. 对 于 一 个 数组 ， 我 们 只 能 够 做 两 件 事 : 确定 该 数组 的 大 小 ， 以 及 获得 指向 
该 数组 下 标 为 0 的 元 素 的 指针 。 其 他 有 关 数 组 的 操作 ， 哪 怕 它 们 乍 看 上 去 是 以 数 
组 下 标 进行 运算 的 ， 实 际 上 都 是 通过 指针 进行 的 。 换 名 话说 ， 任 何 一 个 数组 下 标 
运算 都 等 同 于 一 个 对 应 的 指针 运算 ， 因 此 我 们 完全 可 以 依据 指针 行为 定义 数组 下 
标的 行为 。 

一 且 我 们 彻底 和 弄 懂 了 这 两 点 以 及 它们 所 隐 含 的 意思 ,那么 理解 C 语言 的 数组 
运算 就 不 过 是 “小 菜 一 碟 ”。 如 果 不 清楚 上 述 两 点 内 容 ， 那 么 C 语言 中 的 数组 运 
算 就 可 能 会 给 编程 者 带 来 许多 的 困惑 。 需 要 特别 指出 的 是 ， 编 程 者 应 该 具备 将 数 
组 运算 与 它们 对 应 的 指针 运算 融 汇 贯通 的 能 力 ， 在 思考 有 关 问 题 时 大 脑 中 对 这 两 
种 运算 能 够 自如 切换 、 毫 无 滞 碍 。 许 多 程序 设计 语言 中 都 内 建 有 索引 运算 ， 在 C 
语言 中 索引 运算 是 以 指针 算术 的 形式 来 定义 的 。 

要 理解 C 语言 中 数组 的 运作 机 制 ， 我 们 首先 必须 理解 如 何 声 明 一 个 数组 。 倒 如， 





int al3}; 
这 个 语句 声明 了 a 是 一 个 拥有 3 个 整 型 元 素 的 数组 。 类 似 地 ， 
struct { 
int p[4]; 
double x; 


}b[17]; 


声明 了 b 是 一 个 拥有 17 个 元 素 的 数组 , 其 中 每 个 元 素 都 是 一 个 结构 , 该 结构 中 包 
括 了 一 个 拥有 4 个 整 型 元 素 的 数组 (命名 为 p) 和 一 个 双 精 度 类 型 的 变量 (命名 
为 x)。 

现在 考虑 下 面 的 例子 ， 


int calendar[12] [311]1; 
这 个 语句 声明 了 calendar 是 一 个 数组 ,该 数组 拥有 12 个 数组 类 型 的 元 素 , 其 中 每 
个 元 素 都 是 一 个 拥有 31 个 整 型 元 素 的 数组 。( 而 不 是 一 个 拥有 31 个 数组 类 型 的 元 
素 的 数组 ， 其 中 每 个 元 素 又 是 一 个 拥有 12 个 整 型 元 素 的 数组 。) 因此 ， 
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sizeof(calendar) 的 值 是 372 (31 X12) 与 sizeoftinb 的 乘积 。 


如 果 calendar 不 是 用 于 sizeof 的 操作 数 ,而 是 用 于 其 他 的 场合 , 那么 calendar 
总 是 被 转换 成 一 个 指向 calendar 数组 的 起 始 元 素 的 指针 。 要 理解 上 面 这 句 话 的 含 
义 ， 我 们 首先 必须 理解 有 关 指 针 的 一 些 细节 。 

任何 指针 都 是 指向 某 种 类 型 的 变量 。 例 如 ， 如 果 有 这 样 的 语句 : 

int *ip; 
就 表明 jp 是 一 个 指向 整 型 变量 的 指针 。 又 如 果 声 明 ， 

int i; 


那么 我 们 可 以 将 整 型 变量 ;的 地 址 赋 给 指针 ip， 就 像 下 面 这 样 : 


而 且 ， 如 果 我 们 给 *ip 赋值 ， 就 能 够 改变 i 的 取 值 ; 

*ip = 17; 

如 果 一 个 指针 指向 的 是 数组 中 的 一 个 元 素 ， 那 么 我 们 只 要 给 这 个 指针 加 1， 
就 能 够 得 到 指向 该 数组 中 下 一 个 元 素 的 指针 。 同 样 地 ， 如 果 我 们 给 这 个 指针 减 1， 
得 到 就 是 指向 该 数组 中 前 一 个 元 素 的 指针 。 对 于 除 1 之 外 其 他 整数 的 情形 ， 依 此 
类 推 。 

上 面 这 段 讨论 上 暗示 了 这 样 一 个 事实 : 给 一 个 指针 加 上 一 个 整数 ， 与 给 该 指针 
的 二 进 制 表示 加 上 同样 的 整数 ， 两 者 的 含义 截然 不 同 。 如 果 ip 指向 一 个 整数 ， 那 
么 ip+1l 指向 的 是 计算 机 内 存 中 的 下 一 个 整数 ， 在 大 多 数 现代 计算 机 中 ， 它 都 不 同 
于 认 所 指向 地 址 的 下 一 个 内 存 位 置 。 

如 果 两 个 指针 指向 的 是 同一 个 数组 中 的 元 素 ， 我 们 可 以 把 这 两 个 指针 相 减 。 
这 样 做 是 有 意义 的 ， 例 如 : 

int *q = p+ i; 
那么 我 们 可 以 通过 q- p 而 得 到 i 的 值 。 值得 注意 的 是 ， 如 果 p 与 q 指向 的 不 是 同 
一 个 数组 中 的 元 素 ， 即 使 它们 所 指向 的 地 址 在 内 存 中 的 位 置 正好 间隔 一 个 数组 元 
素 的 整数 倍 ， 所 得 的 结果 仍然 是 无 法 保证 其 正确 性 的 。 

本 节 前 面 已 经 声明 了 a 是 一 个 拥有 3 个 整 型 元 素 的 数组 。 如 果 我 们 在 应 该 出 
现 指 针 的 地 方 ， 却 采用 了 数组 名 来 替换 ， 那 么 数组 名 就 被 当 作 指向 该 数组 下 标 为 
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0 的 元 素 的 指针 。 因 此 如 果 我 们 这 样 写 ， 
p= a 
就 会 把 数组 a 中 下 标 为 0 的 元 素 的 地 址 赋值 给 p。 注 意 ， 这 里 我 们 并 没有 写成 
p= &a; 
这 种 写法 在 ANSIC 中 是 非法 的 ， 因 为 &a 是 一 个 指向 数组 的 指针 ， 而 p 是 一 
个 指向 整 型 变量 的 指针 ， 它 们 的 类 型 不 匹配 。 大 多 数 早期 版 本 的 C 语言 实现 中 ， 
并 没有 所 谓 “ 数 组 的 地 址 ”这 一 概念 ， 因 此 &a 或 者 被 视 为 非法 ， 或 者 就 等 于 a。 


继续 我 们 的 讨论 ， 现 在 p 指向 数组 a 中 下 标 为 0 的 元 素 ，p+1 指向 数组 a 中 
下 标 为 1 的 元 素 ，p+2 指向 数组 a 中 下 标 为 2 的 元 素 ， 依 次 类 推 。 如 果 希 望 p 指 
向 数组 a 中 下 标 为 1 的 元 素 ， 可 以 这 样 写 : 

p=p+1; 
当然 ， 该 语句 完全 等 同 于 下 面 的 写法 : 

P++; 

除了 a 被 用 作 运 算 符 sizeof 的 参数 这 一 情形 ， 在 其 他 所 有 的 情形 中 数组 名 a 
都 代表 指向 数组 a 中 下 标 为 0 的 元 素 的 指针 。 正如 我 们 合乎 情理 的 期 待 ，sizeof(a) 
的 结果 是 整个 数组 a 的 大 小 ， 而 不 是 指向 数组 a 的 元 素 的 指针 的 大 小 。 

从 上 面 的 讨论 中 ， 我 们 不 难得 出 一 个 推论 ，*a 即 数组 a 中 下 标 为 0 的 元 素 的 
引用 。 例 如 ， 我 们 可 以 这 样 写 : 

*a = 84; 

这 个 语句 将 数组 a 中 下 标 为 0 的 元 素 的 值 设置 为 84。 同 样 道理 ，*(a+1) 是 数组 a 
中 下 标 为 1 的 元 素 的 引用 ， 依 次 类 推 。 概 而 言 之 ，*(ati) 即 数组 a 中 下 标 为 i 的 元 
素 的 引用 ， 这 种 写法 是 如 此 常用 ， 因 此 它 被 简 记 为 afi] 。 

正 是 这 一 概念 让 许多 C 语言 新 手 难 于 理解 。 实 际 上 ， 由 于 a+i 与 ita 的 含义 
一 样 ， 因 此 afi] 与 ila] 也 具有 同样 的 含义 。 也 许 某 些 汇编 语言 程序 员 会 发 现 后 一 种 
写法 很 熟悉 ， 但 我 们 绝对 不 推荐 这 种 写法 。 

现在 我 们 可 以 考虑 “二 维 数组 ”了 ， 正 如 前 面 所 讨论 的 ， 它 实际 上 是 以 数组 为 
元 素 的 数组 。 尽管 我 们 也 可 以 完全 依据 指针 编写 操纵 一 维 数 组 的 程序 ， 这样 做 在 一 
维 情形 下 并 不 困难 , 但 是 对 于 二 维 数组 从 记 法 上 的 便利 性 来 说 采用 下 标 形 式 就 几乎 
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是 不 可 替代 的 了 。 还 有 ， 如 果 我 们 仅仅 使 用 指针 来 操纵 二 维 数组 ， 我 们 将 不 得 不 与 
C 语言 中 最 为 “ 星 暗 不 明 ” 的 部 分 打交道 ， 并 常常 遭遇 潜伏 着 的 编译 器 bug。 

让 我 们 回 过 头 来 再 看 前 面 的 几 个 声明 ; 

int calendar[12] [31]; 

TIT oy 


int Ts 


然后 ， 考 一 考 自己 ，calendar[4] 的 含义 是 什么 ? 

因为 calendar 是 一 个 有 着 12 个 数组 类 型 元 素 的 数组 , 它 的 每 个 数组 类 型 元 素 
又 是 一 个 有 着 31 个 整 型 元 素 的 数组 ， 所 以 calendar[4] 是 calendar 数组 的 第 5 个 元 
素 ， 是 calendar 数组 中 12 个 有 着 31 个 整 型 元 素 的 数组 之 一 。 因 此 ，calendar[4] 
的 行为 也 就 表现 为 一 个 有 着 31 个 整 型 元 素 的 数组 的 行为 .例如 , sizeoflcalendar[4]) 
的 结果 是 31 与 sizeof(int) 的 乘积 。 又 如 ， 

p = calendar[4]; 
这 个 语句 使 指针 p 指向 了 数组 calendar[4] 中 下 标 为 0 的 元 素 。 

如 果 calendar[4] 是 一 个 数组 ， 我 们 当然 可 以 通过 下 标的 形式 来 指定 这 个 数组 
中 的 元 素 ， 就 像 下 面 这 样 ， 

i = calenaGar [4] [7]; 
我 们 也 确实 可 以 这 样 做 。 还 是 与 前 面 类 似 的 道理 ， 这 个 语句 可 以 写成 下 面 这 样 而 
表达 的 意思 保持 不 变 ; 

i = *(calendqar [4]+7) 
这 个 语句 还 可 以 进一步 写成 ， 

i = *{(*{(calendar+4)+7); 

从 这 里 我 们 不 难 发 现 ， 用 带 方 插 号 的 下 标 形式 很 明显 地 要 比 完全 用 指针 来 表 
达 简 便 得 多 。 

下 面 我 们 再 看 : 

p = calendar; 


这 个 语句 是 非法 的 。 因 为 calendar 是 一 个 二 维 数组 ， 即 “数组 的 数组 ”， 在 此 
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处 的 上 下 文中 使 用 calendar 名 称 会 将 其 转换 为 一 个 指向 数组 的 指针 ;而 p 是 一 个 
指向 整 型 变量 的 指针 , 这 个 语句 试图 将 一 种 类 型 的 指针 赋值 给 另 一 种 类 型 的 指针 ， 
所 以 是 非法 的 。 

很 显然 ， 我 们 需要 一 种 声明 指向 数组 的 指针 的 方法 。 经 过 了 第 2 章 中 对 类 似 
问题 不 厌 其 烦 的 讨论 ， 构 造 出 下 面 的 语句 应 该 不 需要 费 多 大 力气 : 

int (*ap) [31]; 

这 个 语句 实际 的 效果 是 ， 声 明了 *ap 是 一 个 拥有 31 个 整 型 元 素 的 数组 ， 因 此 
ap 就 是 一 个 指向 这 样 的 数组 的 指针 。 因 而 ， 我 们 可 以 这 样 写 : 

int calendar[12] [31]; 

int (*monthp) (31]; 

monthp = calendar; 

这 样 ，monthp 将 指向 数组 calendar 的 第 1 个 元 素 , 也 就 是 数组 calendar 的 12 
个 有 着 31 个 元 素 的 数组 类 型 元 素 之 一 。 

假定 在 新 的 一 年 开始 时 ， 我 们 需要 清空 calendar 数组 ， 用 下 标 形式 可 以 很 容 
易 做 到 : 

int month; 

for (month=0; month<12; month++) { 

int day; 
for (day = 0; day < 31; day++) 
calendar [month] [day] = 0; 
} 


上 面 的 代码 段 如 果 采 用 指针 应 该 如 何 表示 呢 ? 我 们 可 以 很 容易 地 把 
calendar [month] [day] = 0; 

表示 为 
*(*(calendar + month) + day) = 0; 

但 是 真正 有 关 的 部 分 是 哪些 昵 ? 


如 果 指 针 monthp 指向 一 个 拥有 31 个 整 型 元 素 的 数组 ， 而 calendar 的 元 素 也 
是 一 个 拥有 31 个 整 型 元 素 的 数组 , 因此 就 像 在 其 他 情况 中 我 们 可 以 使 用 一 个 指针 
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遍历 一 个 数组 一 样 ， 这 里 我 们 同样 可 以 使 用 指针 monthp 以 步 进 的 方式 遍历 数组 
calendar: 
int (*monthp) [31]; 


for {monthp = calendar; monthp < &calendar[12]; monthp++) 


/* 处 理 一 个 月 份 的 情况 */ 


同样 地 ， 我 们 可 以 像 处 理 其 他 数组 一 样 ， 处 理 指针 monthp 所 指向 的 数组 的 
元 素 : 
int (*monthp) [31]; 
for {monthp = calendar; monthp < &calendar[12]; monthp++){ 
int *dayp; 
for (aaypP = *monthp; dayp<&{(*monthp) [31]; dayp++} 
*dayp = 0; 


到 目前 为 止 , 我 们 一 路 行 来 几乎 是 “如 履 注 冰 ”而 且 已 经 走 得 太 远 ， 在 我 们 
跌 蒋 之 前 ， 最 好 趁早 悬崖 勒 马 。 尽 管 本 节 中 最 后 一 个 例子 是 合法 的 ANSI C 程序 ， 
但 是 作者 还 没有 找到 一 个 能 够 让 该 程序 顺利 通过 编译 的 编译 器 。( 详 注 : 现在 大 多 
数 的 C 编译 器 能 够 接受 上 面 例 子 中 的 代码 ,〉 上 面 例子 的 讨论 虽然 有 些 偏 离 本 书 
的 主题 ,但 是 这 个 例子 能 够 很 好 地 揭示 出 C 语 言 中 数组 与 指针 之 间 的 独特 的 关系 ， 
从 而 更 清楚 明白 地 阅 述 这 两 个 概念 。 


3.2” 非 数组 的 指针 


在 C 语 言 中 , 字符 串 常量 代表 了 一 块 包括 字符 串 中 所 有 字符 以 及 一 个 空 字 符 
《YA0) 的 内 存 区 域 的 地 址 。 因 为 C 语言 要 求 字符 串 常 量 以 空 字符 作为 结束 标志 ， 
对 于 其 他 字符 串 ，C 程序 员 通 常 也 沿用 了 这 一 惯例 。 

假定 我 们 有 两 个 这 样 的 字符 串 s 和 t, 我 们 希望 将 这 两 个 字符 串 连 接 成 单个 字 
符 串 r 。 要 做 到 这 一 点 ， 我 们 可 以 借助 常用 的 库 函 数 strcpy 和 strcat。 下 面 的 方法 
似乎 一 目 了 然 ， 可 是 却 不 能 满足 我 们 的 目标 : 
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char *r; 

strcpy (lr, s); 

strcat(r, t); 

之 所 以 不 行 的 原因 在 于 不 能 确定 r 指向 何 处 。 我 们 还 应 该 看 到 ， 不 仅 要 让 r 
指向 一 个 地 址 ， 而 且 r 所 指向 的 地 址 处 还 应 该 有 内 存 空间 可 供 容 纳 字符 串 ， 这 个 
内 存 空间 应 该 是 以 某 种 方式 已 经 被 分 配 了 的 。 

我 们 再 试 一 次 ， 记 住 给 r 分 配 一 定 的 内 存 空 间 : 

char r[100]; 

strcpy (r, s); 

strcat (r, t); 

只 要 s 和 + 指向 的 字符 串 并 不 是 太 大 ， 那 么 现在 我 们 所 用 的 方法 就 能 够 正常 
工作 。 不 幸 的 是 ，C 语言 强制 要 求 我 们 必须 声明 数组 大 小 为 一 个 常量 ， 因 此 我 们 
不 够 确保 r 足够 大 。 然 而 ， 大 多 数 C 语言 实现 为 我 们 提供 了 一 个 库 函 数 malloc， 
该 函数 接受 一 个 整数 ， 然 后 分 配 能 够 容纳 同样 数目 的 字符 的 一 块 内 存 。 大 多 数 C 
语言 实现 还 提供 了 一 个 库 函数 strlen， 该 函数 返回 一 个 字符 串 中 所 包括 的 字符 数 。 
有 了 这 两 个 库 函 数 ， 似 乎 我 们 就 能 够 像 下 面 这 样 操作 了 : 

char *r, *malloc( ); 

r = malloc(strlen(s} + strlenl(t)); 

strcpy (r, s); 

strcat (r, t); 

这 个 例子 还 是 错 的 ， 原 因 归 纳 起 来 有 三 个 。 第 一 个 原因 ，malloc 函数 有 可 能 
无 法 提供 请 求 的 内 存 ， 这 种 情况 下 malloc 函数 会 通过 返回 一 个 空 指针 来 作为 “内 
存 分 配 失 败 ” 事 件 的 信号 。 

第 二 个 原因 ， 给 r 分 配 的 内 存在 使 用 完 之 后 应 该 及 时 释放 ， 这 一 点 务必 要 记 
住 。 因 为 在 前 面 的 程序 例子 中 r 是 作为 一 个 局 部 变量 声明 的 ， 因 此 当 离 开 r 作用 
域 时 , r 自动 被 释放 了 。 修 订 后 的 程序 显 式 地 给 r 分 配 了 内 存 ， 为 此 就 必须 显 式 地 
释放 内 存 。 

第 三 个 原因 ， 也 是 最 重要 的 原因 ， 就 是 前 面 的 例 程 在 调用 malloc 函数 时 并 未 
分 配 足够 的 内 存 。 我 们 再 回忆 一 下 字符 串 以 空 字符 作为 结束 标志 的 惯例 。 库 函数 
strlen 返回 参数 中 字符 串 所 包括 的 字符 数目 , 而 作为 结束 标志 的 空 字符 并 未 计算 在 
内 。 因此 ,如 果 strlen(s) 的 值 是 n, 那么 字符 串 实际 需要 n+1 个 字符 的 空间 。 所 以 ， 
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我 们 必须 为 r 多 分 配 一 个 字符 的 空间 。 做 到 了 这 些 ， 并 上 及 注意 检查 了 函数 malloc 
是 否 调用 成 功 ， 我 们 就 得 到 正确 的 结果 : 
Char *r，xmalloc( ):; 
上 = malloc(strlen{s) + strlen(t}) + 1); 
if(!r) { 
complain(}; 
exit (1); 
} 
strcpy (r, s); 


strcat (r, t); 


/* 一 段 时 间 之 后 再 使 用 */ 


freel(r); 


3.3 ”作为 参数 的 数组 声明 


在 C 语言 中 ， 我 们 没有 办 法 可 以 将 一 个 数组 作为 函数 参数 直接 传递 。 如 果 我 
们 使 用 数组 名 作为 参数 ， 那 么 数组 名 会 立刻 被 转换 为 指向 该 数组 第 | 个 元 素 的 指 
针 。 例 如 ， 下 面 的 语句 : 

char hellof] = "hello"; 
声明 了 helio 是 一 个 字符 数组 。 如 果 将 该 数组 作为 参数 传递 给 一 个 函数 ， 

printf("%s\n", hello); 
实际 上 与 将 该 数组 第 1 个 元 素 的 地 址 作为 参数 传递 给 函数 的 作用 完全 等 效 ， 即 ; 

printf("%s\n", &hello[0]); 

因此 ， 将 数组 作为 函数 参数 毫 无 意义 。 所 以 ，C 语言 中 会 自动 地 将 作为 参数 
的 数组 声明 转换 为 相应 的 指针 声明 。 也 就 是 说 ， 像 这 样 的 写法 : 


int strlen(char s{]) 


{ 
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/* 具体 内 容 */ 

} 
与 下 面 的 写法 完全 相同 : 

int strien(char* s) 

{ 

/* 具体 内 容 */ 

} 

C 程序 员 经 常 错误 地 假设 ， 在 其 他 情形 下 也 会 有 这 种 自动 地 转换 。 本 书 4.5 
节 详 细 地 讨论 了 一 个 具体 的 例子 ， 程 序 员 经 常 在 此 处 遇 到 麻烦 : 

extern char *hello; 
这 个 语句 与 下 面 的 语句 有 着 天 渊 之 别 ; 

extern char hellol[]; 

如 果 一 个 指针 参数 并 不 实际 代表 一 个 数组 ， 即 使 从 技术 上 而 言 是 正确 的 ， 采 
用 数组 形式 的 记 法 经 常会 起 到 误导 作用 。 如 果 一 个 指针 参数 代表 一 个 数组 ， 情 况 
又 是 如 何 呢 ? 一 个 常见 的 例子 就 是 函数 main 的 第 二 个 参数 : 

main(int argc, char* argv[]) 

{ 

/* 具体 内 容 */ 

} 
这 种 写法 与 下 面 的 写法 完全 等 价 : 

maint{int argc, char** argv) 

{ 

/* 具体 内 容 */ 

4 

需要 注意 的 是 , 前 一 种 写法 强调 的 重点 在 于 argv 是 一 个 指向 某 数 组 的 起 始 元 
素 的 指针 ， 该 数组 的 元 素 为 字符 指针 类 型 。 因 为 这 两 种 写法 是 等 价 的 ， 所 以 读者 
可 以 任 选 一 种 最 能 清楚 反映 自己 意图 的 写法 。 
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3.4 ”避免 “ 举 隅 法 ” 


“ 举 隅 法 ”(synecdoche) 是 一 种 文学 修辞 上 的 手段 ， 有 点 类 似 于 以 微笑 表示 
喜悦 、 赞 许 之 情 ， 或 以 隐喻 表示 指 代 物 与 被 指 物 的 相互 关系 。 在 《牛津 英语 辞典 》 
中 ， 对 “ 举 隅 法 ”(synecdoche) 是 这 样 解 释 的 :“ 以 含义 更 宽泛 的 词语 来 代替 含 
义 相 对 较 窜 的 词语 ， 或 者 相反 ;， 例如， 以 整体 代表 部 分 ， 或 者 以 部 分 代表 整体 ， 
以 生物 的 类 来 代表 生物 的 种 ， 或 者 以 生物 的 种 来 代表 生物 的 类 ， 等 等 。” 


《牛津 英语 辞典 》 中 这 一 词 条 的 说 明 ， 倒 是 恰 如 其 份 地 描述 了 C 语言 中 一 个 
常见 的 “陷阱 ” 混淆 指针 与 指针 所 指向 的 数据 。 对 于 字符 串 的 情形 ， 编 程 者 更 是 
经 常 犯 这 种 错误 。 例 如 : 

Char *p, *q; 

Pp = "xyz"; 

尽管 某 些 时 候 我 们 可 以 不 妨 认 为 ， 上 面 的 赋值 语句 使 得 p 的 值 就 是 字符 串 
"xyz"， 然 而 实际 情况 并 不 是 这 样 ， 记 住 这 一 点 尤其 重要 。 实 际 上 ，Pp 的 值 是 一 个 
指向 由 Xx'、'y'"、'z" 和 \0'4 个 字符 组 成 的 数组 的 起 始 元 素 的 指针 。 因 此 ， 如 果 我 们 执 
行 下面 的 语句 : 

qd=P; 

p 和 q 现在 是 两 个 指向 内 存 中 同一 地 址 的 指针 。 这 个 赋值 语句 并 没有 同时 复制 内 
存 中 的 字符 。 我 们 可 以 用 图 3.1 来 表示 这 种 情况 : 





图 3.1 指针 复制 示意 图 


我 们 需要 记 住 的 是 ， 复 制 指针 并 不 同时 复制 指针 所 指向 的 数据 。 
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因此 ， 当 我 们 执行 完 下 面 的 语句 之 后 : 
G[1] = '¥'; 
q 所 指向 的 内 存 现在 存储 的 是 字符 串 xYz。 因 为 p 和 gd 所 指向 的 是 同一 块 内 存 ， 
所 以 p 指向 的 内 存 中 存储 的 当然 也 十 字符 串 xYz。 
译注 : ANSIC 标准 中 禁止 对 string literal 作出 修改 。K&RC 中 对 这 一 问题 的 说 


明 是 ， 试 图 修改 字符 串 常 量 的 行为 是 未 定义 的 。 某 些 C 编译 器 还 允许 qf[1] = 'Y' 这 种 
修改 行为 ， 如 LCC v3.6。 但 是 ， 这 种 写法 不 值得 提倡 。 









3.5” 空 指针 并 非 空 字符 串 


除了 一 个 重要 的 例外 情况 , 在 C 语言 中 将 一 个 整数 转换 为 一 个 指针 ， 最 后 得 
到 的 结果 都 取决 于 具体 的 C 编译 器 实现 。 这 个 特殊 情况 就 是 常数 0， 编 译 器 保证 
由 0 转换 而 来 的 指针 不 等 于 任何 有 效 的 指针 。 出 于 代码 文档 化 的 考虑 ， 常 数 0 这 
个 值 经 常用 一 个 符号 来 代替 : 

#define NULL 0 
当然 无 论 是 直接 用 常数 0， 还 是 用 符号 NULL， 效 果 都 是 相同 的 。 需 要 记 住 的 重 
要 一 点 是 ， 当 常数 0 被 转换 为 指针 使 用 时 ， 这 个 指针 绝对 不 能 被 解除 引用 
(dereference)。 换 名 话说， 当 我 们 将 0 赋值 给 一 个 指针 变量 时 ， 绝 对 不 能 企图 使 
用 该 指针 所 指向 的 内 存 中 存储 的 内 容 。 下 面 的 写法 是 完全 合法 的 : 

if (P == (char *) 0) ... 
但 是 如 果 要 写成 这 样 : 

if (strcmplp, {char *) 0) == 0) ..,. 
就 是 非法 的 了 , 原因 在 于 库 函 数 strcmp 的 实现 中 会 包括 查看 它 的 指针 参数 所 指向 
内 存 中 的 内 容 的 操作 。 

如 果 p 是 一 个 空 指针 ， 即 使 

printf (p); 


和 
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printf("%s", p); 
的 行为 也 是 未 定义 的 。 而 且 , 与 此 类 似 的 语句 在 不 同 的 计算 机 上 会 有 不 同 的 效果 。 
本 书 7.6 节 详 细 讨 论 了 这 个 问题 。 


3.6 ”边界 计算 与 不 对 称 边 界 


如 果 一 个 数组 有 10 个 元 素 ， 那 么 这 个 数组 下 标的 允许 取 值 范围 是 什么 呢 ? 

这 个 问题 对 于 不 同 的 程序 设计 语言 有 着 不 同 的 答案 。 例如 , 对 于 Fortran, PL/I 
以 及 Snobol4 等 程序 语言 ， 这 个 数组 的 下 标 取 值 缺 省 从 1 开始 ， 而 且 这 些 语言 也 
允许 编程 者 另外 指定 数组 下 标的 起 始 值 。 而 对 于 Algol 和 Pascal 语言 ， 数 组 下 标 
没有 缺 省 的 起 始 值 ， 编 程 者 必须 显 式 地 指定 每 个 数组 的 下 界 与 上 上 界 。 在 标准 的 
Basic 语言 中 ,声明 一 个 拥有 10 个 元 素 的 数组 , 实际 上 编译 器 分 配 了 11 个 元 素 的 
宁 间 ， 下 标 范 围 从 0 到 10。 
译注 ,Basic 中 声明 数组 时 实际 上 指定 的 是 上 界 ， 而 下 界 默认 为 0. 










Dim Counters(14) As Integer ' 15 个 元 素 
Dim Sums(20) As Double '21 个 元 素 
Basic 中 也 可 以 同时 指定 数组 上 界 与 下 界 ， 如 : 


Dim Counters(1 To 15) As Integer 





Dim Sums(100 To 120) As String 


在 C 语言 中 , 这 个 数组 的 下 标 范 围 是 从 0 到 9。 一 个 拥有 10 个 元 素 的 数组 中 ， 
存在 下 标 为 0 的 元 素 , 却 不 存在 下 标 为 10 的 元 素 。C 语言 中 一 个 拥有 n 个 元 素 的 
数组 ， 却 不 存在 下 标 为 n 的 元 素 ， 它 的 元 素 的 下 标 范围 是 从 0 到 n-1 为 此 ， 由 其 
他 程序 语言 转 而 使 用 C 语言 的 程序 员 在 使 用 数组 时 特别 要 注意 。 

例如 ， 让 我 们 仔细 地 来 看 看 本 书 导读 中 的 ~- 段 代码 : 


int i, aa[10]， 





for (i=1; i<=10; i++) 


al[lil] 全 0; 
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这 段 代码 本 意 是 要 设置 数组 a 中 所 有 元 素 为 0, 却 产 生 了 一 个 出 人 意料 的 “ 副 
效果 ”。 在 for 语句 的 比较 部 分 本 来 是 i< 10， 却 写成 了 i <= 10， 因 此 实际 上 并 不 
存在 的 al10] 被 设置 为 0， 也 就 是 内 存 中 在 数组 a 之 后 的 一 个 字 〈word) 的 内 存 被 
设置 为 0。 如 果 用 来 编译 这 段 程序 的 编译 器 按照 内 存 地 址 递减 的 方式 来 给 变量 分 
配 内 存 ， 那 么 内 存 中 数组 a 之 后 的 一 个 字 〈word) 实际 上 是 分 配给 了 整 型 变量 i。 
此 时 ， 本 来 循环 计数 器 i 的 值 为 10， 循 环 体内 将 并 不 存在 的 al10] 设 置 为 0， 实际 
上 却 是 将 计数 器 i 的 值 设置 为 0， 这 就 陷入 了 一 个 死 循环 。 


尽管 C 语言 的 数组 会 让 新 手感 到 麻烦 , 然而 C 语言 中 数组 的 这 种 特别 的 设计 
正 是 其 最 大 优势 所 在 。 要 理解 这 一 点 ， 需 要 作 一 些 解 释 。 


在 所 有 常见 的 程序 设计 错误 中 ， 最 难于 察觉 的 一 类 是 “栏杆 错误 ”， 也 常 被 称 
为 “ 差 一 错误 ”(off-by-one error)。 还 记得 本 书 导 读 中 的 第 2 个 练习 提出 的 问题 吗 ? 
那个 问题 说 的 是 ，100 英尺 长 的 围栏 每 隔 10 英尺 需要 一 根 支 撑 用 的 栏杆 ， 一 共 需 
要 多 少 根 栏杆 呢 ? 如 果 不 加 思索 ， 最 “显而易见 ”的 答案 是 将 100 除 以 10， 得 到 
的 结果 是 10， 即 需要 10 根 栏杆 。 当 然 这 个 答案 是 错误 的 ， 正 确 答案 是 11。 


也 许 , 得 出 正确 答案 的 最 容易 方式 是 这 样 考虑 : 要 支撑 10 英尺 长 的 围栏 实际 
需要 2 根 栏杆 ， 两 端 各 一 根 。 这 个 问题 的 另 一 种 考虑 方式 是 : 除了 最 右 侧 的 一 段 
围栏 , 其 他 每 一 段 10 英尺 长 的 围栏 都 只 在 左 侧 有 一 根 栏杆 ; 而 例外 的 最 右 侧 一 段 
围栏 不 仅 左 侧 有 一 根 栏 奸 ， 右 侧 也 有 一 根 栏杆 。 

前 面 一 段 讨 论 了 解决 这 个 问题 的 两 种 方法 ， 实 际 上 提示 了 我 们 避免 “栏杆 错 
误 ” 的 两 个 通用 原则 ; 

(1) 首先 考虑 最 简单 情况 下 的 特例 ， 然 后 将 得 到 的 结果 外 推 ， 这 是 原则 一 。 

(2) 仔细 计算 边界 ， 绝 不 掉以轻心 ， 这 是 原则 二 。 

将 上 面 总 结 的 内 容 牢记 在 心 以 后 ， 我 们 现在 来 看 整数 范围 的 计算 。 例 如 ， 假 
定 整数 x 满足 边界 条 件 x>=16 且 x<=37, 那么 此 范围 内 x 的 可 能 取 值 个 数 有 多 少 ? 
换 句 话说 ， 整 数 序列 16，17，...，37 一 共有 多 少 个 元 素 ? 很 显然 ， 答 案 与 37-16 
( 亦 妈 21) 非常 接近 ， 那 么 到 底 是 20，21 还 是 22 呢 ? 


根据 原则 一 ， 我 们 考虑 最 简单 情况 下 的 特例 。 这 里 假定 整数 x 的 取 值 范围 上 
界 与 下 界 重 合 ， 即 x>=16 且 x<=16， 显 然 合 理 的 x 取 值 只 有 1 个 整数 ， 即 16。 所 
以 当 上 界 与 下 界 重合 时 ， 此 范围 内 满足 条 件 的 整数 序列 只 有 1 个 元 素 。 
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再 考虑 一 般 的 情形 ， 假 定 下 界 为 1， 上 界 为 h。 如 果 满 足 条 件 “ 上 界 与 下 界 重 
合 ”， 即 1=h， 亦 即 h -1=0。 根 据 特例 外 推 的 原则 ， 我 们 可 以 得 出 满足 条 件 的 整 
数 序列 有 h - 1+ 1 个 元 素 。 在 本 例 中 ， 就 是 37- 16+ 1， 即 22。 

造成 “栏杆 错误 ”的 根源 正 是 “h -1+ 1” 中 的 “+ 1?”。 一 个 字符 串 中 由 下 标 
为 16 到 下 标 为 37 的 字符 元 素 所 组 成 的 子囊， 它 的 长 度 是 多 少 呢 ? 稍 不 留意 ， 就 
会 得 到 错误 的 结果 21。 很 自然 地 ， 人 们 会 问 这 样 一 个 问题 : 是 否 存 在 一 些 编程 技 
巧 ， 能 够 降低 这 类 错误 发 生 的 可 能 性 呢 ? 

这 个 编程 技巧 不 但 存在 ， 而 且 可 以 一 言 以 蔽 之 : 用 第 一 个 入 界 点 和 第 一 个 出 
界 点 来 表示 一 个 数值 范围 。 具 体 而 言 ， 前 面 的 例子 我 们 不 应 说 整数 x 满足 边界 条 
件 x>=16 且 x<=37， 而 是 说 整数 x 满足 边界 条 件 x>=16 且 x<38。 注意 ， 这 里 下 界 
是 “入 界 点 ” 即 包括 在 取 值 范围 之 中 ， 而 上 界 是 “出 界 点 ”， 即 不 包括 在 取 值 范 
围 之 中 。 这 种 不 对 称 也 许 从 数学 上 而 言 并 不 优美 ， 但 是 它 对 于 程序 设计 的 简化 效 
果 却 足以 令 人 吃惊 


1. 取 值 范围 的 大 小 就 是 上 界 与 下 界 之 差 。38 一 16 的 值 是 22， 恰 恰 是 不 对 称 
边界 16 和 38 之 间 所 包括 的 元 素数 目 。 

2. 如 果 取 值 范围 为 室 ， 那 么 上 界 等 于 下 界 。 这 是 第 1 条 的 直接 推论 。 

3, 即使 取 值 范围 为 室 ， 上 界 也 永远 不 可 能 小 于 下 界 。 

对 于 像 C 这 样 的 数组 下 标 从 0 开始 的 语言 ， 不 对 称 边界 给 程序 设计 带 米 的 便 
利 尤 其 明显 : 这 种 数组 的 上 界 ( 即 第 一 个 “出 界 点 ”) 恰 是 数组 元 素 的 个 数 ! 内 此 ， 
如 果 我 们 要 在 C 语言 中 定义 一 个 拥有 10 个 元 素 的 数组 ， 那 么 0 就 是 数组 下 标的 
第 一 个 “入 界 点 ”( 指 处 于 数组 下 标 范 围 以 内 的 点 ， 包 括 边 界 点 )， 而 10 就 是 数组 
下 标 中 的 第 一 个 “出 界 点 ”〈 指 不 在 数组 下 标 范围 以 内 的 点 ， 不 含 边界 点 )。 正 因 
为 此 ， 我 们 这 样 写 ; 

int ali0], i; 

for (i = 0; i < 10; I++) 

已 [了 | 0; 
而 不 是 写成 下 面 这 样 : 
int a[10], i; 


for (i = 0; i <= 9; i++) 
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afil = 0; 

让 我 们 作 一 个 假设 ， 如 果 C 语言 的 for 语句 风格 类 似 Algol 或 者 Pascal 语言 ， 
那么 就 会 带 来 一 个 问题 : 下 面 这 个 语句 的 含义 究竟 是 什么 ? 

for ‘(i = 0 to ‘10) 

a[i] = 0; 

如 果 10 是 包括 在 取 值 范围 内 的 “入 界 点 ” 那么 将 取 11 个 值 ， 而 不 是 10 
个 值 。 如 果 10 是 不 包括 在 取 值 范围 内 的 “出 界 点 ”， 那 么 原来 以 其 他 程序 语言 ; 
背景 的 编程 者 会 大 为 惊讶 。 

男 一 种 考虑 不 对 称 边界 的 方式 是 ,把 上 界 视 作 某 序列 中 第 一 个 被 占用 的 元 素 ， 
而 把 下 界 视 作 序 列 中 第 一 个 被 释放 的 元 素 。 如 图 3.2 所 示 : 


可 用 区 域 已 占用 区 域 可 用 区 域 


“入 界 ” 下 界 








出 界 ” 上 界 
图 3.2 数组 不 对 称 边界 示意 图 


当 处 理 各 种 不 同类 型 的 缓冲 区 时 ， 这 种 看 待 问题 的 方式 就 特别 有 用 。 例 如 ， 
考虑 这 样 一 个 函数 ， 该 函数 的 功能 是 将 长 度 无 规律 的 输入 数据 送 到 缓冲 区 〈 即 一 
块 能 够 容纳 N 个 字符 的 内 存 ) 中 去 ， 等 当 这 块 内 存 被 “ 填 满 ”时 ， 就 将 缓冲 区 的 
内 容 写 出 。 缓 冲 区 的 声明 可 能 是 下 面 这 个 样子 : 

#define N 1024 


static char buffer[N]; 
我 们 再 设置 一 个 指针 变量 ， 让 它 指向 缓冲 区 的 当前 位 置 : 

static char *bufptr; 

对 于 指针 bufptr， 我 们 应 该 把 重点 放 在 哪个 方面 呢 ? 是 让 指针 bufptr 始终 指 
向 缓冲 区 中 最 后 一 个 已 占用 的 字符 ， 还 是 让 它 指向 缓冲 区 中 第 一 个 未 占用 的 字 
符 ? 前 一 种 选择 很 有 吸引 力 ， 但 是 考虑 到 我 们 对 “不 对 称 边 界 ” 的 偏好 ， 后 一 种 
选择 更 为 适合 。 
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按照 “不 对 称 边界 ”的 惯例 ， 我 们 可 以 这 样 编写 语句 : 

*bufptr++ = Cr 
这 个 语句 把 输入 字符 c 放 到 缓冲 区 中 ， 然 后 指针 bufptr 递增 1， 又 指向 缓冲 区 中 
第 1 个 未 占用 的 字符 。 

根据 前 面 对 “ 不 对 称 边界 ”的 考察 ， 当 指针 bufptr 与 &buffer[0] 相 等 时 ， 组 冲 
区 存放 的 内 容 为 室 ， 因 此 初始 化 时 声明 缓冲 区 为 空 可 以 这 样 写 : 

bufptr = &buftfezr[0]:; 

或 者 ， 更 简洁 一 点 ， 直 接 写 成 : 

bufptr = buffer; 

任何 时 候 缓冲 区 中 已 存放 的 字符 数 都 是 bufptr - buffer， 因 此 我 们 可 以 通过 将 
这 个 表达 式 与 N 作 比 较 ， 来 判断 缓冲 区 是 否 已 满 。 当 缓冲 区 全 部 “ 填 满 ”时 ， 表 
达 式 bufptr - buffer 就 等 于 N， 可 以 推断 缓冲 区 中 未 占用 的 字符 数 为 N - (bufptr - 
buffer) 。 

前 面 所 有 的 这 些 预 备 知识 一 旦 掌握 ， 我 们 就 可 以 开始 编写 程序 了 ， 假 设 这 个 
函数 的 名 称 是 bufwrite。 函 数 bufwrite 有 两 个 参数 ， 第 一 个 参数 是 一 个 指针 ， 指 
向 将 要 写 入 缓冲 区 的 第 1 个 字符 ;第 二 个 参数 是 一 个 整数 ， 代 表 将 要 写 入 缓冲 区 
的 字符 数 。 假 定 我 们 可 以 调用 函数 flushbuffer 来 把 缓冲 区 中 的 内 容 写 出 ， 而 且 函 
数 flushbuffer 会 重 置 指针 bufptr， 使 其 指向 缓冲 区 的 起 始 位 置 。 如 下 所 示 : 

void 

bufwrite{char *p, int n) 


{ 


while (--n >= 0) { 
if (bufptr == &buffer[N]) 
flushbuffer(); 


*bufptr++ = *pP++} 
} 
} 
重复 执行 表达 式 --n >= 0 只 是 进行 n 次 迭代 的 一 种 方法 。 要 验证 这 一 点 ， 我 
们 可 以 考察 最 简单 的 特例 情形 ，n = 1※ 。 因 为 循环 执行 n 次 ， 每 次 迭代 从 输入 
缓冲 区 中 取 走 一 个 字符 ， 所 以 输入 的 每 个 字符 都 将 得 到 处 理 ， 而 且 也 不 会 额外 执 


49 


C 陷阱 与 缺陷 


行 多 余 的 处 理 操 作 。 











有 是 我 们 3 
我 们 注意 到 前 面 代 码 段 中 出 现 了 bufptr 与 &buffer[IN] 的 比较 ， 而 buffer[N] 这 

个 元 素 是 不 存在 的 ! 数组 buffer 的 元 素 下 标 从 0 到 N - 1， 根 本 不 可 能 是 N。 我 们 
用 这 种 写法 : 

it (bufptr == &buffer[N]) 
代替 了 下 面 等 效 的 写法 : 

if (bufptr > &buffer[N - 11]) 
原因 在 于 我 们 要 坚持 遵循 “不 对 称 边界 ”的 原则 ， 我 们 要 比较 指针 bufptr 与 缓冲 
区 后 第 一 个 字符 的 地 址 ， 而 多 buffer[N] 正 是 这 个 地 址 。 但 是 ， 引 用 一 个 并 不 存在 
的 元 素 又 有 什么 意义 呢 ? 

幸运 的 是 ， 我 们 并 不 需要 引用 这 个 元 素 ， 而 只 需要 引用 这 个 元 素 的 地 址 ， 并 
且 这 个 地 址 在 我 们 遇 到 的 所 有 C 语言 实现 中 又 是 “ 千 真 万 确 ” 存 在 的 。 而且, ANSI 
C 标准 明确 允许 这 种 用 法 : 数组 中 实际 不 存在 的 “ 溢 界 ”元 素 的 地 址 位 于 数组 所 
占 内 存 之 后 ， 这 个 地 址 可 以 用 于 进行 赋值 和 比较 。 当 然 ， 如 果 要 引用 该 元 素 ， 那 
就 是 非法 的 了 。 

照 前 面 的 写法 ， 程 序 已 经 能 够 工作 ， 但 是 我 们 还 可 以 进一步 优化 ， 以 提高 程 
序 的 运行 速度 。 尽 管 一 般 而 论 程序 优化 问题 超过 了 本 书 所 涉及 的 范围 ， 但 这 个 特 
定 的 例子 中 还 是 有 值得 我 们 考察 其 有 关 计 数 方面 的 特性 。 

这 个 程序 绝 大 部 分 的 开销 来 自 于 每 次 迭代 都 要 进行 的 两 个 检查 :一 个 检查 用 
于 判断 循环 计数 器 是 否 到 达 终 值 ， 另 一 个 检查 用 于 判断 缓冲 区 是 否 已 满 。 这 样 做 
的 结果 就 是 一 次 只 能 转移 一 个 字符 到 缓冲 区 。 

假定 我 们 有 一 种 方法 能 够 一 次 移动 k 个 字符 。 大 多 数 C 语言 实现 (以 及 全 部 
正确 的 ANSI C 实现 ) 都 有 一 个 库 函 数 memcpy， 可 以 做 到 这 一 点 ， 而 且 这 个 函数 
通常 是 用 汇编 语言 实现 的 以 提高 运行 速度 。 即 使 你 的 C 语言 实现 没有 提供 这 个 函 
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数 ， 自 己 写 一 个 也 很 容易 ， 
void 
memcpy {char *dest, const char *source, int k) 


{ 
while {--k >= 0) 


*dest++ = *SOUurCett+;}; 


} 


我 们 现在 可 以 让 函数 bufwrite 利用 库 函 数 memcpy 来 一 次 转移 一 批 字符 到 组 
冲 区 ， 而 不 是 一 次 仅 转移 一 个 字符 。 循 环 中 的 每 次 迭代 在 必要 时 会 刷新 缓存 ， 计 
算 需 要 移动 的 字符 数 ， 移 动 这 些 字 符 ， 最 后 恰当 地 更 新 计数 器 。 如 下 所 示 : 


void 
bufwrite(char *p, int n) 
{ 
while (n > 0) { 
int k, rem; 
if (bufptr == &buffer[{N]) 
flushbuffert{),; 
rem = N - (bufptr - buffer); 
k= n > rem? rem: n; 
memcpy {bufptr, p, Kk); 
bufptr += k; 
p += k; 


n -= k; 
} 


很 多 编程 者 在 写 出 这 样 的 程序 时 ， 总 是 感到 有 些 犹 豫 不 决 ， 他 们 担心 可 能 会 
写 错 。 而 有 的 程序 员 似 乎 很 有 些 “ 大 无 其 ”精神 ， 最 后 结果 还 是 写 错 了 。 确 实 ， 
像 这 样 的 代码 技巧 性 很 强 ， 如 果 没 有 很 好 的 理由 ， 我 们 不 应 该 尝试 去 做 。 但 是 如 
果 是 “ 师 出 有 名 ”， 那 么 理解 这 样 的 代码 应 该 如 何 写 就 很 重要 了 。 只 要 我 们 记 住 前 
面 的 两 个 原则 ， 特 例外 推 法 和 仔细 计算 边界 ， 我 们 应 该 完全 有 信心 做 对 。 
在 循环 的 入 口 处 ，n 是 需要 转移 到 缓冲 区 的 字符 数 。 因 此 ， 只 要 nm 还 大 于 0， 
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也 就 是 还 有 剩余 字符 没有 被 转移 ， 循 环 就 应 该 继续 进行 下 去 。 每 次 进入 循环 体 ， 
我 们 将 要 转移 k 个 字符 到 缓冲 区 中 ， 而 不 是 像 过 去 一 样 每 次 只 转移 一 个 字符 。 上 
面 的 代码 中 ， 最 后 四 行 语句 管理 着 字符 转移 的 过 程 ，(1) 从 缓冲 区 中 第 1 个 未 占 
用 字符 开始 ,复制 k 个 字符 到 其 中 ; (2) 将 指针 bufptr 指向 的 地 址 前 移 k 个 字符 ， 
使 其 仍然 指向 缓冲 区 中 第 1 个 未 占用 字符 : (3》 输入 字符 串 的 指针 p 前 移 k 个 字 
符 ; (4) 将 n( 即 待 转移 的 字符 数 ) 减 去 k。 我 们 很 容易 看 到 ， 这 些 语 句 正确 地 完 
成 了 各 自任 务 。 


在 循环 的 一 开始 ， 仍 然 保 留 了 原来 版 本 中 的 第 一 个 检查 ， 如 果 绥 冲 区 已 满 ， 
则 刷新 之 ， 并 重 管 指针 bufptr。 这 就 保证 了 在 检查 之 后 ， 缓 冲 区 中 还 有 空间 。 

惟一 困难 的 部 分 就 是 确定 k， 即 在 保证 缓冲 区 安全 (不 发 生 溢出 ) 的 情况 下 、 
可 以 一 次 转移 的 最 多 字符 数 。k 是 下 面 两 个 数 中 较 小 的 一 个 ;输入 数据 中 还 剩余 
的 待 转移 学 符 数 〈 即 n)， 以 及 缓冲 区 中 未 占用 的 字符 数 〈 即 rem)。 

计算 rem 的 方法 有 两 种 。 前 面 的 例子 显示 了 其 中 的 一 种 ;缓冲 区 中 当前 可 用 
字符 数 〈 即 rem)， 是 缓冲 区 中 总 的 字符 数 (N) 减 去 已 占用 的 字符 数 《〈 即 bufptr - 
buffer》 的 差 ， 也 就 是 N - (bufptr - buffer)。 

另 一 种 计算 rem 的 方法 是 把 缓冲 区 中 的 空余 部 分 看 成 一 个 区 间 ， 直 接 计算 这 
个 区 间 的 长 度 。 指 针 bufptr 指向 这 个 区 间 的 起 点 ,而 buffer + N( 也 就 是 &buffer[N]) 
指向 这 个 区 间 的 终点 (出 界 点 )。 并 且 它 们 满足 “不 对 称 边 界 ” 的 条 件 ， 指 针 bufptr 
由 于 指向 的 是 第 1 个 未 占用 字符 ， 因 此 是 “入 界 点 ” 而 你 buffer[IN] 所 代表 的 位 置 
在 数组 buffer 最 后 一 个 元 素 buffer[N - 1 之后， 因此 是 “出 界 点 ”。 所 以 ， 根 据 我 
们 的 这 一 观点 ， 缓 冲 区 中 的 可 用 字符 数 为 (buffer + N) - bufptr 。 稍 稍 思考 ， 我 们 
就 会 发 现 

(buffer + N) - bufptr 


完全 等 价 于 


N - (bufptr - buffer) 


再 看 一 个 与 计数 有 关 的 例子 。 这 个 例子 中 ， 我 们 需要 编写 一 个 程序 ， 该 程序 
按 一 定 顺序 生成 一 些 整数 ， 并 将 这 些 整数 按 列 输出 。 把 这 个 例子 的 要 求 说 得 更 明 
确 一 点 就 是 ， 程序 的 输出 可 能 包括 若干 页 的 整数 ， 每 页 包括 NCOLS 列 ， 每 列 又 


52 


第 3 章 语义 “陷阱 


包括 NROWS 个 元 素 ， 每 个 元 素 就 是 一 个 待 输出 的 整数 。 还 要 注意 ， 程 序 生成 的 
整数 是 按 列 连 续 分 布 的 ， 而 不 是 按 行 分 布 的 。 

对 这 个 例子 ， 我 们 关注 的 重点 应 该 放 在 与 计数 有 关 的 特性 方面 ， 因 此 不 妨 再 
做 一 些 简化 的 假设 。 首先, 我们 假定 这 个 程序 是 由 两 个 函数 print 和 flush 来 实现 。 
而 决定 哪些 数值 应 该 打印 ， 是 其 他 程序 的 责任 。 每 次 当 有 新 的 数值 生成 时 ， 这 个 
另外 的 程序 就 会 把 该 数值 作为 参数 传递 给 函数 print， 要 注意 函数 print 仅 当 缓冲 
区 己 满 时 才 打 印 , 未 满 时 将 该 数值 存 入 缓冲 区 ; 而 当 最 后 ~ 个 数值 生成 出 来 之 后 ， 
就 会 调用 函数 flush 刷新 , 此 时 无 论 缓冲 区 是 否 已 满 , 其 中 所 有 的 数值 都 将 被 打印 。 
其 次 ， 我们 假定 打印 任务 分 别 由 三 个 函数 完成 : 函数 printnum 在 本 页 的 当前 位 置 
打印 一 个 数值 ， 函 数 printnl 旭 打 印 一 个 换行 符 ， 另 起 新 的 一 行 ， 函 数 printpage 
则 打印 一 个 分 页 符 ， 另 起 新 的 一 页 。 每 一 行 都 必须 以 换行 符 结束 ， 即 使 是 ~ 页 中 
的 最 后 一 行 也 必须 以 换行 符 结束 后 ， 然 后 再 打印 一 个 分 页 符 。 这 些 打印 函数 按照 
从 左 到 右 的 顺序 “填充 ”每 个 输出 行 ， 一 行 被 打印 后 就 不 能 被 撤销 或 变更 。 

对 于 这 个 问题 , 我 们 需要 意识 到 的 第 一 点 就 是 , 如 果 要 完成 程序 要 求 的 任务 ， 
某 种 形式 的 缓冲 区 必 不 可 少 。 我 们 必须 在 看 到 第 1 列 的 所 有 元 素 之 后 ， 才 可 能 知 
道 第 2 列 的 第 1 个 元 素 (也 就 是 第 1 行 的 第 2 个 元 素 ) 的 内 容 。 介 是， 我 们 又 必 
须 在 打印 完 第 1 行 之 后 ， 才 有 可 能 打印 第 1 列 的 第 2 个 元 素 ( 凤 第 2 行 的 第 1 个 
元 素 )。 

这 个 缓冲 区 应 该 有 多 大 昵 ? 千 一 看 来 ， 缓 冲 区 似乎 需要 能 够 大 到 足以 容纳 一 
整 页 的 数值 ， 细 细 一 想 ， 并 不 需要 这 么 大 的 空间 : 因为 按照 问题 的 定义 ， 我 们 知 
道 每 页 的 列 数 与 行 数 ， 那 么 对 于 最 后 一 列 中 的 每 个 元 素 ， 也 就 是 相应 行 的 最 后 一 
个 元 素 ， 只 要 我 们 得 到 它 的 数值 ， 就 可 以 立即 打印 出 来 。 因 此 ， 我 们 的 缓冲 区 不 
必 包 括 最 后 一 列 : 

#define BUFSIZE (NROWS* (NCOLS-1)) 

static int buffer[BUFSIZE]; 

我 们 之 所 以 声明 buffer 为 静态 数组 , 是 为 了 预防 它 被 程序 的 其 他 部 分 存 取 到 。 
本 书 的 4.3 节 详 细 讨 论 了 static 声明 。 

我 们 对 函数 print 的 编程 策略 大 致 如 下 : 如 果 缓 冲 区 未 满 ， 就 把 生成 的 数值 放 
到 缓冲 区 中 ， 而 当 缓 冲 区 已 满 时 ， 此 时 读 入 的 数值 就 是 一 页 中 最 后 1 列 的 某 个 元 
素 ， 这 时 就 打印 出 该 元 素 所 对 应 的 行 〈 按 照 上 一 段 中 所 讲 的 ， 这 个 元 素 可 以 直接 
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打印 ， 不 必 放 入 缓冲 区 )。 当 一 页 中 所 有 的 行 都 已 经 和 输出， 我们 就 清空 缓冲 区 。 


需要 注意 ， 这 些 整数 进入 缓冲 区 的 顺序 与 出 缓冲 区 的 顺序 并 不 一 致 ， 我 们 是 
按 列 接受 数值 ， 却 是 按 行 打印 数值 。 这 就 出 现 了 一 个 问题 ， 在 缓冲 区 中 是 同一 行 
的 元 素 相 邻 排列 还 是 同一 列 的 元 素 相 邻 排列 ? 我 们 可 以 任意 选择 一 种 方式 ， 这 里 
假定 是 同一 列 的 元 素 相 邻 排列 。 这 种 选择 使 所 有 的 数值 进入 缓冲 区 非常 地 直 堆 了 
当 ， 径 直 连 续 排列 下 去 就 是 了 ， 但 是 出 缓冲 区 的 方式 却 相 对 复杂 一 些 。 要 跟踪 元 
素 进入 缓冲 区 时 所 处 的 位 置 ， 一 个 指针 就 足够 了 。 我 们 可 以 初始 化 这 个 指针 ， 使 
其 指向 缓冲 区 的 第 1 个 元 素 : 
static int *bufptr = buffer; 
现在 ， 我 们 对 函数 print 的 结构 算是 有 了 一 点 眉目 。 函 数 print 接受 一 个 整 型 
参数 ， 如 果 缓冲 区 还 有 空间 ， 就 将 其 置 入 缓冲 区 ; 否则， 执行 “ 某 些 暂时 不 能 确 
定 的 操作 ”。 让 我 们 把 到 目前 为 止 对 函数 print 的 一 些 认识 记录 下 来 : 
void 
print (int n) 
{ 
if (bufptr == &buffer{BUFSIZE]) { 
/* 某 些 暂时 不 能 确定 的 操作 */ 
}else 
*bufptr++ == Nn; 


} 


这 里 的 “ 某 些 暂 时 不 能 确定 的 操作 ”包括 了 打印 当前 行 的 所 有 元 素 ， 使 当前 
行 的 序号 递增 1， 如 果 一 页 内 的 所 有 行 都 已 经 打印 ， 则 另 起 新 的 一 页 。 为 了 做 到 
这 些 ， 很 显然 我 们 需要 记 住 当 前 行 号 ， 因 此 ， 我 们 声明 一 个 局 部 静态 变量 row 来 
存储 当前 行 号 。 

我 们 如 何 做 到 打印 当前 行 的 所 有 元 素 呢 ? 乍 一 想 似乎 漫 无 头绪 ， 实 际 上 如 果 
看 待 问题 的 方式 恰当 ， 也 就 是 俗话 所 说 “思路 对 了 ”， 则 相当 简单 。 我 们 知道 ,对 
于 序号 为 row 的 行 ， 其 第 1 个 元 素 就 是 buffer[row]， 并 且 元 素 buffer[row] 肯 定 存 
在 。 因 为 元 素 buffer[row] 属 于 第 1 列 ， 如 果 它 不 存在 ， 则 我 们 根本 不 可 能 通过 f 
语句 的 条 件 判断 。 我 们 还 知道 ， 同 一 行 中 的 相 邻 元 素 在 缓冲 区 中 是 相隔 NROWS 
个 元 素 排列 的 。 最 后 ， 我 们 知道 指针 bufptr 指向 的 位 置 刚 好 在 缓冲 区 中 最 后 一 个 
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已 占用 元 素 之 后 。 因 此 ， 我 们 可 以 通过 下 面 这 个 循环 语 名 来 打印 缓冲 区 中 属于 当 
前 行 的 所 有 元 素 〈 注 意 ， 当 前 行 的 最 后 一 个 元 素 不 在 缓冲 区 ， 所 以 是 “缓冲 区 中 
属于 当前 行 的 所 有 元 素 ”， 而 不 是 “当前 行 的 所 有 元 素 ”): 

int *p; 

for {p = buffer+row; p < bufptr; p += NROWS) 


printnum(*p); 


这 里 为 了 简洁 起 见 ， 我 们 用 buffert+row 代替 了 &buffer[row] 。 

剩 下 的 “暂时 不 能 确定 的 操作 ”就 很 简单 了 : 打印 当前 输入 数值 〈《 即 当前 行 
的 最 后 一 个 元 素 ), 打印 换行 符 以 结束 当前 行 , 如 果 是 一 页 的 最 后 一 行 还 要 另 起 新 
的 一 页 : 


printnum{n); /* 打印 当前 行 的 最 后 一 个 元 素 */ 
printnl{) ; /* 另 起 新 的 一 行 */ 
if (++row == NROWS) { 

printpage(}); 

row = 0; /* 重 冒 当前 行 号 */ 


bufptr = buffer; /* 重 置 指针 pufptr */ 


因此 ， 最 后 的 print 函数 看 上 去 就 像 这 样 : 


void 
print (int n) 
{ 
if (bufptr == &buffer[BUFSIZE]) { 
static int row = 0; 
int *p; 


for (p = buffer+row; p < bufptr; 


P += NROWS} 
printnum(*p); 
printnum(n); /+ 打印 当前 行 的 最 后 一 个 元 素 */ 
printni(); /* 另 起 新 的 一 行 */ 
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if (++row == NROWS) { 
printpage (); 
row = 0; /* 重 置 当前 行 序号 */ 


bufptr = buffer;  /* 重 置 指针 pbufptr */ 


} else 
*bufptr++ = n; 


】 


现在 我 们 接近 大 功 告 成 了 : 只 需要 编写 函数 ftush， 它 的 作用 是 打印 缓冲 区 中 
所 有 剩余 元 素 。 要 做 到 这 一 点 , 基本 机 制 与 函数 print 中 打印 当前 行 所 有 元 素 类 似 ， 
只 需要 将 其 作为 内 循环 , 在 其 上 另外 套 一 个 外 循环 (作用 是 遍历 一 页 中 的 每 一 行 ): 


void 
flush!() 
{ 
int row; 
for (row = 0; row < NROWS; row++) { 
Trt *ps 
for {p = buffer + row; p < bufptr; 
p += NROWS) 
printnum(*p); 
printnl(); 
} 
printpage{); 


} 


函数 flush 的 这 个 版 本 显得 有 些 太 中 规 中 和 矩 、 平 白 无 奇 了 : 如 果 最 后 一 页 只 包 
括 仅 仅 一 列 甚至 是 不 完全 的 一 列 ， 函 数 flush 仍然 会 逐 行 打印 出 全 部 的 一 页 ， 只 不 
过 没有 元 素 的 地 方 都 是 空白 而 已 。 事实 上 ,即使 最 后 一 页 为 空 ， 函数 flush 仍然 还 - 
会 全 部 打印 出 来 ， 只 不 过 一 页 全 是 空白 而 已 。 从 技术 上 说 ， 这 种 做 法 虽然 也 满足 
了 问题 定义 中 的 要 求 ， 但 却 不 符合 程序 美学 的 观点 。 如 果 没 有 数值 可 供 打印 ， 就 
应 该 立即 停止 打印 。 我 们 可 以 通过 计算 缓冲 区 中 有 多 少 项 来 做 到 这 一 点 。 如 果 组 
冲 区 中 什么 也 没有 ， 我 们 并 不 需要 开始 新 的 一 页 ; 
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void 
flusht) 
{ 
int row; 
int k = bufptr - buffer; /* 计算 缓冲 区 中 剩余 项 的 数目 */ 
if (k > NROWS) 
k = NROWS; 
if (k > 0) { 
for (row = 0; row < k; row++) { 
int *p; 
for (p = buffer + row; p < bufptr; 
p += NROWS) 
printnum(*p); 
printnl (}),， 
} 
printpage(); 


3.7” 求 值 顺序 


本 书 2.2 节 讨 论 了 运算 符 优 先 级 的 问题 。 求 值 顺序 则 完全 是 另 一 码 事 。 运 算 
符 优先 级 是 关于 诸如 表达 式 

a + bw ec 
应 该 被 解释 成 

a + (b * ce) 
而 不 是 

(a + b) * c 


的 这 样 一 类 规则 。 求 值 顺序 是 另 一 类 规则 ， 可 以 保证 像 下 面 的 语句 
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if (count != 0 && sum/count < smallaverage) 
printf{({"average < %g\n", smallaverage); 


即使 当 变量 count 为 0 时 ， 也 不 会 产生 一 个 “用 0 作 除 数 ” 的 错误 。 


C 语言 中 的 某 些 运算 符 总 是 以 一 种 已 知 的 、 规 定 的 顺序 来 对 其 操作 数 进 行 求 
值 ， 而 另外 一 些 则 不 是 这 样 。 例 如 ， 考 虑 下 面 的 表达 式 ， 

aa<b&&gec<ada 

C 语言 的 定义 中 说 明 a<b 应 当 首 先 被 求 值 。 如 果 a 确实 小 于 b， 此 时 必须 进 
一 步 对 c<d 求 值 ， 以 确定 整个 表达 式 的 值 。 但是， 如 果 a 大 于 或 等 于 b， 则 无 需 
对 c<d 求 值 ， 表 达 式 肯定 为 假 。 


另外 ， 要 对 a <b 求 值 ， 编译 器 可 能 先 对 a 求 值 ， 也 可 能 先 对 b 求 值 ， 在 某 些 
机 器 上 甚至 有 可 能 对 它们 同时 并 行 求 值 。 

C 语言 中 只 有 四 个 运算 符 (& 及 、 He 、?: 和 ,) 存在 规定 的 求 值 顺序 。 运 算 符 
六 & 和 运算 符 ll 首先 对 左 侧 操 作 数 求 值 , 只 在 需要 时 才 对 右 侧 操作 数 求 值 。 运算 符 ?: 
有 三 个 操作 数 : 在 a?b:c 中 ， 操 作 数 a 首先 被 求 值 ， 根 据 a 的 值 再 求 操 作 数 b 或 c 
的 值 。 而 逗号 运算 符 ， 首 先 对 左 侧 操作 数 求 值 ， 然 后 该 值 被 “丢弃 ”， 再 对 右 侧 操 
作 数 求 值 。 







C 语言 中 其 他 所 有 运算 符 对 其 操作 数 求 值 的 顺序 是 未 定义 的 。 特 别 地 ， 赋 值 
运算 符 并 不 保证 任何 求 值 顺序 。 

运算 符 &&& 和 运算 符 I 对 于 保证 检查 操作 按照 正确 的 顺序 执行 至 关 重 要 。 例 如 ， 
在 语句 

if (y != 0 && x/y > tolerance) 

complain(}; 

中 ， 就 必须 保证 仅 当 y 非 0 时 才 对 xyy 求 值 。 

下 面 这 种 从 数组 x 中 复制 前 n 个 元 素 到 数组 y 中 的 做 法 是 不 正确 的 ， 因 为 它 
对 求 值 顺 序 作 了 太 多 的 假设 : 


58 


第 3 章 语义 “ 陷 寻 ” 


i = 0; 
while (i < n) 
yY[i] = x[i++]; 
问题 出 在 哪里 呢 ? 上 面 的 代码 假设 y[i 的 地 址 将 在 i 的 自 增 操作 执行 之 前 被 
求 值 ， 这 一 点 并 没有 任何 保证 ! 在 C 语言 的 某 些 实现 上 ， 有 可 能 在 i 自 增 之 前 被 
求 值 ， 而 在 另外 一 些 实现 上 ， 有 可 能 与 此 相反 。 同 样 道理 ， 下 面 这 种 版 本 的 写法 
与 前 类 似 ， 也 不 正确 : 
i = 0; 
while {i < n) 
y[i++] = x[il; 
另 一 方面 ， 下 面 这 种 写法 却 能 正确 工作 : 
i = 0; 
while (i < n) { 
yY[li] = x[il; 


} 


当然 ， 这 种 写法 可 以 简写 为 : 
for (i = 0; i < n; i++) 


y[i] = x[il]; 


3.8 ”运算 符 &&.、 中 和 ! 


C 语言 中 有 两 类 好 辑 运 算 符 ， 某 些 时 候 可 以 互 换 ; 按 位 运算 符 &、| 和 ~， 以 
及 逻辑 运算 符 &&&、1 和 ! 。 如 果 程序 员 用 其 中 一 类 的 某 个 运算 符 替 换 掉 男 一 类 
中 对 应 的 运算 符 ， 他 也 许 会 大 吃 一 惊 ， 互 换 之 后 程序 看 上 去 还 能 “正常 ”工作 ， 
但 是 实际 上 这 只 是 巧合 所 致 。 


按 位 运算 符 &、| 和 ~ 对 操作 数 的 处 理 方式 是 将 其 视 作 一 个 二 进 制 的 位 序 
列 ， 分 别 对 其 每 个 位 进行 操作 。 例 如 ，10&12 的 结果 是 8 二 进 制 表示 为 1000)， 
因为 运算 符 && 按 操作 数 的 二 进 制 表 示 逐 位 比较 10 (二 进 制 表示 为 1010) 和 12 (二 
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进 制 表示 为 1100),， 当 且 仪 当 两 个 操作 数 的 一 进 制 表示 的 某 位 上 同时 是 1, 最 后 结 
果 的 … 进 制 表 示 中 该 位 才 是 1。 同 样 道理 , 10I12 的 结果 是 14( 二进制 表示 为 1110)， 
而 ~10 的 结果 是 -11 (二 进 制 表示 为 11...110101)， 至 少 在 以 一 进 制 补 色 表示 负数 
的 机 器 上 是 这 个 结果 。 

另 一 方面 ， 逻 辑 运 算 符 &&&、1| 和 ! 对 操作 数 的 处 理 方式 是 将 其 视 作 要 人 么 是 
“ 真 ”， 要 么 是 “ 假 ”。 道 常 约定 将 0 视 作 “ 假 ” 而 非 0 视 作 “ 真 "。 这 些 运算 符 当 
结果 为 “ 真 ”时 返回 1， 当 结果 为 “ 假 ” 时 返回 0， 它 们 只 可 能 返回 0 或 1。 而 且 ， 
运算 符 廊 & 利 运算 符 I 在 左 侧 操作 数 的 值 能 够 确定 最 终结 果 时 根本 不 会 对 右 侧 操作 
数 求 值 。 

因此 ， 我 们 能 够 很 容易 求 得 这 个 表达 式 的 结果 : !10 的 结果 是 0， 因 为 10 是 
非 0 数 ，10&&12 的 结果 是 1， 因 为 10 和 12 都 不 是 0，10Il12 的 结果 也 是 1， 
为 10 不 是 0。 而且， 在 最 后 一 个 式 子 中 ，12 根本 不 会 被 求 值 ， 企 表达 式 loIf( ) 
中 ，f( ) 也 不 会 被 求 值 。 

考虑 下 面 的 代码 段 ， 其 作用 是 在 表 中 查询 一 个 特定 的 元 素 : 

1 0 

while {i < tabsize && tabl[li] != X) 

i++} | 

这 个 循环 语句 的 用 意 是 ; 如 果 i 等 于 tabsize 时 循环 终止 ， 就 说 明 在 表 中 没有 
发 现 要 找 的 元 素 ; 而 如 果 是 其 他 情况 ， 此 时 i 的 值 就 是 要 找 的 元 素 在 表 中 的 索引 。 
注意 在 这 个 循环 中 用 到 了 不 对 称 边界 。 

假定 我 们 无 意 中 用 运算 符 & 替 换 了 上 面 语句 中 的 运算 符 &&: 

j= 0 

while (i < tabsize & tab[i] != x) 

这 个 循环 语句 也 有 可 能 “正常 ”工作 ， 但 仅仅 是 因为 两 个 非常 侥 率 的 原因 。 

第 一 个 “侥幸 ”是 ，while 中 的 表达 式 & 运 算 符 的 两 侧 都 是 比较 运算 ， 而 比较 
运算 的 结果 在 为 “ 真 ” 时 等 于 1， 在 为 “ 假 ”时 等 于 0。 只 要 x 和 yy 的 取 值 都 限制 
在 0 或 1， 那 么 x&y 与 x&&y 总 是 得 出 相同 的 结果 。 然 而 ， 如 果 两 个 比较 运算 中 
的 任何 一 个 用 除 1 之 外 的 非 0 数 代表 “ 真 ”， 那 么 这 个 循环 就 不 能 正常 工作 了 。 
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第 二 个 “侥幸 ”是 ， 对 于 数组 结尾 之 后 的 下 一 个 元 素 〈 实 际 上 是 不 存在 的 )， 
只 要 程序 不 去 改变 该 元 素 的 值 ， 而 仅仅 读 取 它 的 值 ， 一 般 情 况 下 是 不 会 有 什么 危 
害 的 。 运 算 符 色 和 运算 符 && 不 同 ， 运 算 符 & 两 侧 的 操作 数 都 必须 被 求 值 。 所 以 在 
后 一 个 代码 段 中 ， 如 果 tabsize 等 于 tab 中 的 元 素 个 数 ， 当 循环 进入 最 后 一 次 迭代 
时 ， 即 使 ;等 于 tabsize， 也 就 是 说 数组 元 素 tab[ 实 际 上 并 不 存在 ， 程 序 仍然 会 查 
看 元 素 的 值 。 

回忆 一 下 我 们 在 本 书 的 3.6 节 中 曾经 提 到 的 内 容 ， 对 于 数组 结尾 之 后 的 下 一 
个 元 素 , 取 它 的 地 址 是 合法 的 。 而 这 一 节 中 我 们 试图 去 实际 地 读 取 这 个 元 素 的 值 ， 
这 种 做 法 的 结果 是 未 定义 的 ， 而 县 绝 少 有 C 编译 器 能 够 检测 出 这 个 错误 。 


3.9 ”整数 溢出 


C 诸 言 中 存在 两 类 整数 算术 运算 ， 有 符号 运算 与 无 符号 运算 。 在 无 符号 算术 
运算 中 ,没有 所 谓 的 “溢出 ”一 说 ; 所 有 的 无 符号 运算 都 是 以 2 的 n 次 方 为 模 ， 
这 里 n 是 结果 中 的 位 数 。 如 果 算 术 运 算 符 的 一 个 操作 数 是 有 符号 整数 ， 另 “个 是 
无 符号 整数 ， 那 么 有 符号 整数 会 被 转换 为 无 符号 整数 ,“ 溢 出 ”也 不 可 能 发 生 。 但 
是 ， 当 两 个 操作 数 都 是 有 符号 整数 时 ,“ 溢 出 ”就 有 可 能 发 生 ， 而 及“ 溢出 ”的 结 
困 是 本 定义 的 。 当 一 个 运算 的 结果 发 生 “溢出 ”时 ， 作 出 任何 假设 都 是 不 安全 的 。 

例如 ， 假 定 a 和 b 是 两 个 非 负 整 型 变量 ， 我 们 需要 检查 atb 是 省 会 “溢出 ”。 
一 种 想当然 的 方式 是 这 样 : 

if (a+b< D0) 


complain(); 

这 并 不 能 正常 运行 。 当 a+b 确实 发 生 “溢出 ”时 ， 所 有 关于 结果 如 何 的 假设 
都 不 再 可 靠 。 例 如 ， 在 某 些 机 器 上 ， 加 法 运算 将 设置 一 个 内 部 寄存 器 为 四 种 状态 
之 一 : 正 、 负 、 零 和 溢出 。 在 这 种 机 器 上 ，C 编译 器 完全 有 理由 这 样 来 实现 上 面 
的 例子 ， 即 a 与 b 相 加 ， 然 后 检查 该 内 部 寄存 器 的 标志 是 否 为 “ 负 ”。 当 加 法 操作 
发 生 “ 滋 出 ”时 ， 这 个 内 部 害 存 器 的 状态 是 谥 出 而 不 是 负 ， 那 么 ff 的 语句 的 检查 
就 会 失败 。 

一 种 正确 的 方式 是 将 a 和 b 都 强制 转换 为 无 符号 整数 ; 
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if ((unsigned)a + (unsigned)b > INT_MAX) . 
complain(); 
此 处 的 INT_MAX 是 一 个 已 定义 常量 , 代表 可 能 的 最 大 整数 值 。 ANSI C 标准 
在 <limits.h> 中 定义 了 INT_MAX: 如 果 是 在 其 他 C 语言 实现 上 ， 读 者 也 许 需 要 自 
己 重 新 定义 。 


不 需要 用 到 无 符号 算术 运算 的 男 一 种 可 行 方法 是 : 


if (a > INT_MAX - b) 


complain(),，; 


3.10 ”为 函数 main 提供 返回 值 


最 简单 的 C 程序 也 许 是 像 下 面 这 样 


main() 

{ 

} 
这 个 程序 包含 一 个 不 易 察觉 的 错误 。 函数 main 与 其 他 任何 函数 一 样 , 如 果 并 未 显 
式 声 明 返回 类 型 ， 那 么 函数 返回 类 型 就 默认 为 是 整 型 。 但 是 这 个 程序 中 并 没有 给 
出 任何 返回 值 。 


通常 说 来 ， 这 不 会 造成 什么 危害 。 一 个 返回 值 为 整 型 的 函数 如 果 返 回 失败 ， 
实际 上 是 隐 含 地 返回 了 某 个 “垃圾 ”整数 。 只 要 该 数值 不 被 用 到 ， 就 无 关 紧 要 。 


然而 ， 在 某 些 情形 下 函数 main 的 返回 值 却 并 非 无 关 紧 要 。 大 多 数 C 语言 实 
现 都 通过 函数 main 的 返回 值 来 告知 操作 系统 该 函数 的 执行 是 成 功 还 是 失败 。 典 型 
的 处 理 方案 是 , 返回 值 为 0 代表 程序 执行 成 功 , 返回 值 非 0 则 表示 程序 执行 失败 。 
如 果 一 个 程序 的 main 函数 并 不 返回 任何 值 , 那么 有 可 能 看 上 去 执行 失败 。 如 果 正 
在 使 用 一 个 软件 管理 系统 ， 该 系统 关注 程序 被 调用 后 执行 是 成 功 还 是 失败 ， 那 么 
很 可 能 得 到 令 人 惊讶 的 结果 。 
严格 说 来 ， 我 们 前 面 的 最 简单 的 C 程序 应 该 像 下 面 这 样 编写 代码 : 
main{) 
{ 
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return 0; 


exit (0); 


最 为 经 典 的 “hello world” 程 序 看 上 去 应 该 像 这 样 : 


#include <staio.h> 


main() { 
printf("hello world\n"); 


return 0; 


练习 3-1、， 假定 对 于 下 标 越 界 的 数组 元 素 即 使 取 其 地 址 也 是 非法 的 ， 那 么 本 
书 3.6 节 中 的 bufwrite 程序 应 该 如 何 写 呢 ? 


练习 3-2， 比较 本 书 3.6 节 中 函数 flush 的 最 后 一 个 版 本 与 以 下 版 本 : 


void 
flusht) 
{ 
int row; 
int k = bufptr - buffer; 
if (k > NROWS) 
k = NROWS; 
for (row = 0; row < k; row++) { 
int *p; 
for {p = buffer + row; p < bufptr; 
p += NROWS) 
printnum(*p); 
printnl(); 
} 
if (k > 0) 
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printpage(); 


练习 3-3. 编写 一 个 函数 ， 对 一 个 已 排序 的 整数 表 执 行 二 分 查找 。 函 数 的 输 
入 包括 一 个 指向 表 头 的 指针 ， 表 中 的 元 素 个 数 ， 以 及 待 查找 的 数值 。 函 数 的 输出 
是 一 个 指向 满足 查找 要 求 的 元 素 的 指针 ， 当 未 查找 到 满足 要 求 的 数值 时 ， 输 出 一 
个 NULL 指针 。 
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一 个 C 程序 可 能 是 由 多 个 分 别 编 译 的 部 分 组 成 ,这 些 不 同 部 分 通过 一 个 通常 
叫做 连接 器 (也 叫 连接 编辑 器 ， 或 载 入 器 ) 的 程序 合并 成 一 个 整体 。 因 为 编译 器 
一 般 每 次 只 处 理 一 个 文件 ， 所 以 它 不 能 检测 出 那些 需要 一 次 了 解 多 个 源 程序 文件 
才能 察觉 的 错误 。 而且， 在 许多 系统 中 连接 器 是 独立 于 C 语言 实现 的 ， 因 此 如 果 
前 述 错误 的 原因 是 与 C 语言 相关 的 ， 连 接 器 对 此 同样 束手无策 。 

某 些 C 语言 实现 提供 了 一 个 称 为 lint 的 程序 ， 可 以 捕获 到 大 量 的 此 类 错误 ， 
但 遗憾 的 是 并 非 全 部 的 C 语言 实现 都 提供 了 该 程序 。 如 果 能 够 找到 诸如 lint 的 程 
序 ， 就 一 定 要 善 加 利用 ， 这 一 点 无 论 怎么 强调 都 不 为 过 。 

在 本 章 中 ， 我 们 将 考查 一 个 典型 的 连接 器 ， 注意 它 是 如 何 对 C 程序 进行 处 理 
的 ， 从 而 归纳 出 一 些 由 于 连接 器 的 特点 而 可 能 导致 的 错误 。 


4.1 什么 是 连接 器 


C 语言 中 的 一 个 重要 思想 就 是 分 别 编译 〈Separate Compilation)， 即 若干 个 源 
.程序 可 以 在 不 同 的 时 候 单 独 进行 编译 ， 然 后 在 恰当 的 时 候 整 合 到 一 起 。 但 是 ， 连 
接 器 一 般 是 与 C 编译 器 分 离 的 ， 它 不 可 能 了 解 C 语言 的 诸多 细节 。 那 么 ， 连 接 器 
是 如 何 做 到 把 若干 个 C 源 程 序 合并 成 一 个 整体 呢 ? 尽管 连接 器 并 不 理解 C 语言 ， 
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然而 它 却 能 够 理解 机 器 语言 和 内 存 布局 。 编 译 器 的 责任 是 把 C 源 程序 “翻译 ”成 
对 连接 器 有 意义 的 形式 ， 这 样 连接 器 就 能 够 “ 读 慌 ”C 源 程序 了 





目标 模块 是 直接 作为 肉 入 提供 给 还 接 器 的 而 另外 一 此 目标 模 沁 风 是 根据 过 近 
程 的 需要 ， 从 包括 有 类 似 printf 函数 的 库 文件 中 取得 的 。 


连接 器 通常 把 目标 模块 看 成 是 由 一 组 外 部 对 象 external object》 组 成 的 。 每 
个 外 部 对 象 代 表 着 机 器 内 存 中 的 某 个 部 分 ， 并 通过 一 个 外 部 名 称 来 识别 。 因 此 ， 
程序 中 的 每 个 函数 和 每 个 外 部 变量 ， 如 果 没 有 被 声明 为 static， 就 都 是 一 个 外 部 对 
象 。 某 些 C 编译 器 会 对 静态 函数 和 静态 变量 的 名 称 做 一 定 改变 ， 将 它们 也 作为 外 
部 对 象 。 由 于 经 过 了 “名 称 修饰 ”， 所 以 它们 不 会 与 其 他 源 程序 文件 中 的 同名 函数 
或 同名 变量 发 生命 名 冲突 。 

大 多 数 连接 器 都 禁止 同一 个 载 入 模块 中 的 两 个 不 同 外 部 对 象 拥有 相同 的 名 
称 。 然 而 ， 在 多 个 目标 模块 整合 成 一 个 载 入 模块 时 ， 这 些 目标 模块 可 能 就 包含 了 
同名 的 外 部 对 象 。 连 接 器 的 一 个 重要 工作 就 是 处 理 这 类 命名 冲突 。 


处 理 命名 冲突 的 最 简单 办 法 就 是 干脆 完全 禁止 .对 于 外 部 对 象 是 函数 的 情形 ， 
这 种 做 法 当然 正确 ， 一 个 程序 如 果 包 括 两 个 同名 的 不 同 函 数 ， 编 译 器 根本 就 不 应 
该 接受 。 而 对 于 外 部 对 象 是 变量 的 情形 ， 问 题 就 变 得 有 些 困 难 了 。 不 同 的 连接 器 
对 这 种 情形 有 着 不 同 的 处 理 方式 ， 我 们 将 在 后 面 看 到 这 一 点 的 重要 性 。 

有 了 这 些 信息 ， 我 们 现在 可 以 大 致 想像 出 连接 器 是 如 何 工作 的 情形 了 。 连 接 
连接 器 的 输出 是 一 个 载 入 模块 。 连 接 器 读 入 
目标 模块 和 库 文件 ， 同 时 生成 载 入 模块 。 对 每 个 目标 模块 中 的 每 个 外 部 对 象 ， 连 
接 器 都 要 检查 载 入 模块 ， 看 是 否 已 有 同名 的 外 部 对 象 。 如 果 没 有 ， 连 接 器 就 将 该 
外 部 对 象 添加 到 载 入 模块 中 ， 如 果 有 ， 连 接 器 就 要 开始 处 理 命名 冲突 。 


除了 外 部 对 象 之 外 ， 目 标 模块 中 还 可 能 包括 了 对 其 他 模块 中 的 外 部 对 象 的 引 
用 。 例 如 ， 一 个 调用 了 函数 printf 的 C 程序 所 生成 的 目标 模块 ， 就 包括 了 一 个 对 
函数 printf 的 引用 。 可 以 推测 得 出 ， 该 引用 指向 的 是 一 个 位 于 某 个 库 文件 中 的 外 
部 对 象 。 在 连接 器 生成 载 入 模块 的 过 程 中 , 它 必 须 同 时 记录 这 些 外 部 对 象 的 引用 。 
当 连 接 器 读 入 一 个 目标 模块 时 ， 它 必须 解析 出 这 个 目标 模块 中 定义 的 所 有 外 部 对 
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象 的 引用 ， 并 作出 标记 说 明 这 些 外 部 对 象 不 再 是 未 定义 的 。 
因为 连接 器 对 C 语言 “知之 甚 少 ”， 所 以 有 很 多 错误 不 能 被 检测 出 来 。 再 次 
强调 ， 如 果 读 者 的 C 语言 实现 中 提供 了 lint 程序 ， 切 记 要 使 用 ! 


4.2 ”声明 与 定义 


下 面 的 声明 语句 : 

int a; 

如 果 其 位 置 出 现在 所 有 的 函数 体 之 外 ， 那 么 它 就 被 称 为 外 部 对 象 a 的 定义 。 
这 个 语句 说 明了 a 是 一 个 外 部 整 型 变量 ， 同 时 为 a 分 配 了 存储 空间 。 因 为 外 部 对 
象 a 并 没有 被 明确 指定 任何 初始 值 ， 所 以 它 的 初始 值 默认 为 0。( 某 些 系 统 中 的 连 
接 器 对 以 其 他 语言 编写 的 程序 并 不 保证 这 一 点 ，C 编译 器 有 责任 以 适当 方式 通知 
连接 器 ， 确 保 未 指定 初始 值 的 外 部 变量 被 初始 化 为 0)。 

下 面 的 声明 语句 

int a = 7} 
在 定义 a 的 同时 也 为 a 明确 指定 了 初始 值 。 这 个 语句 不 仅 为 a 分 配 内 存 ， 而 且 也 
说 明了 在 该 内 存 中 应 该 存储 的 值 。 

下 面 的 声明 语句 

extern int a; 
并 不 是 对 a 的 定义 。 这 个 语句 仍然 说 明了 a 是 一 个 外 部 整 型 变量 ， 但 是 因为 它 包 
括 了 extern 关键 字 , 这 就 显 式 地 说 明了 a 的 存储 空间 是 在 程序 的 其 他 地 方 分 配 的 。 
从 连接 器 的 角度 来 看 ， 上述 声明 是 一 个 对 外 部 变量 a 的 引用 , 而 不 是 对 a 的 定义 。 
因为 这 种 形式 的 声明 是 对 一 个 外 部 对 象 的 显 式 引 用 ， 即 使 它 出 现在 一 个 函数 的 内 
部 , 也 仍然 具有 同样 的 含义 。 下 面 的 函数 srand 在 外 部 变量 random_seed 中 保存 了 
其 整 型 参数 n 的 一 份 拷贝 : 

void 

srand (int n) 

{ 
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extern int random seed; 
random_seed = n; 


} 


每 个 外 部 对 象 都 必须 在 程序 某 个 地 方 进行 定义 。 因 此 ， 如 果 一 个 程序 中 包括 
了 语句 
extern int a; 
那么 ， 这 个 程序 就 必须 在 别 的 某 个 地 方 包括 语句 
int a; 
这 两 个 语句 既 可 以 是 在 同一 个 源 文件 中 ， 也 可 以 位 于 程序 的 不 同 源 文件 之 中 。 
如 果 一 个 程序 对 同一 个 外 部 变量 的 定义 不 止 一 次 ， 又 将 如 何 处 理 昵 ? 也 就 是 
说 ， 假 定 下 面 的 语句 
int a; 
出 现在 两 个 或 者 更 多 的 不 同 源 文件 中 ， 情 况 会 是 怎样 呢 ? 或 者 说 ， 如 果 语 名 
int a = 7; 
出 现在 一 个 源 文 件 中 ， 而 语 名 
int a = 9; 
出 现在 另 一 个 源 文 件 中 ， 将 出 现 什么 样 的 情形 昵 ? 这 个 问题 的 答案 与 系统 有 关 ， 
不 同 的 系统 可 能 有 不 同 的 处 理 方式 。 严 格 的 规则 是 ， 每 个 外 部 变量 只 能 够 定义 一 
次 。 如 果 外 部 变量 的 多 个 定义 各 指定 一 个 初始 值 ， 例 如 ; 
int a = 7; 
出 现在 一 个 源 文件 中 ， 而 
int a = 9; 
出 现在 另 一 个 源 文件 中 ， 大 多 数 系统 都 会 拒绝 接受 该 程序 。 但 是 ， 如 果 一 个 外 部 
变量 在 多 个 源 文 件 中 定义 却 并 没有 指定 初始 值 ， 那 么 某 些 系统 会 接受 这 个 程序 ， 
而 另外 一 些 系统 则 不 会 接受 。 要 想 在 所 有 的 C 语言 实现 中 避免 这 个 问题 ， 惟 一 的 
解决 办 法 就 是 每 个 外 部 变量 只 定义 一 次 。 
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4.3 命名 冲突 与 static 修饰 符 


两 个 具有 相同 名 称 的 外 部 对 象 实际 上 代表 的 是 同一 个 对 象 ， 即 使 编程 者 的 本 
意 并 非 如 此 ， 但 系统 却 会 如 此 处 理 。 因 此 ， 如 果 在 两 个 不 同 的 源 文件 中 都 包括 了 
定义 

int a; 
那么 , 它 或 者 表示 程序 错误 (如 果 连 接 器 禁止 外 部 变量 重复 定义 的 话 ), 或 者 在 两 
个 源 文件 中 共享 a 的 同一 个 实例 (无 论 两 个 源 文件 中 的 外 部 变量 a 是 否 应 该 共享 )。 

即使 其 中 a 的 一 个 定义 是 出 现在 系统 提供 的 库 文件 中 ， 也 仍然 进行 同样 的 处 
理 。 当 然 ，-- 个 设计 良好 的 函数 库 不 至 于 定义 a 作 外 部 名 称 。 但 是 ， 要 了 解 函数 
库 中 定义 的 所 有 外 部 对 象 名 称 却 也 并 非 易 事 。 类 似 于 read 和 write 这 样 的 名 称 不 
难 猜 到 ， 但 其 他 的 名 称 就 没有 这 人 么 容易 了 。 

ANSI C 定义 了 CC 标准 函数 库 ， 列 出 了 经 常用 到 因而 可 能 会 引发 命名 冲突 的 
所 有 函数 。 这 样 ， 我 们 就 容易 避免 与 库 文 件 中 的 外 部 对 象 名 称 发 生 冲 突 。 如 果 一 
个 库 函 数 需 要 调用 另 一 个 未 在 ANSI C 标准 中 列 出 的 库 函 数 ， 那 么 它 应 该 以 “ 隐 
藏 名 称 ” 来 调用 后 者 。 这 就 使 得 程序 员 可 以 定义 一 个 函数 ， 比 如 冰 数 名 为 read， 
而 不 用 担心 库 函 数 getc 本 应 调用 库 文件 中 的 read 函数 , 却 调用 了 这 个 用 户 定义 的 
read 函数 。 但 大 多 数 C 语言 实现 并 不 是 这 样 做 ， 因 此 这 类 命名 冲突 仍然 是 一 个 问 
题 。 

static 修饰 符 是 一 个 能 够 减少 此 类 命名 冲突 的 有 用 工具 。 例如 ， 以 下 声明 诸 句 

static int a; 
其 含义 与 下 面 的 语句 相同 

int a; 
只 不 过 , a 的 作用 域 限制 在 一 个 源 文件 内 , 对 于 其 他 源 文件 , a 是 不 可 见 的 。 因此 ， 
如 果 若 干 个 函数 需要 共享 一 组 外 部 对 象 ， 可 以 将 这 些 函 数 放 到 一 个 源 文件 中 ， 把 
它们 需要 用 到 的 对 象 也 都 在 同一 个 源 文 件 中 以 static 修饰 符 声 明 。 


static 修饰 符 不 仅 适用 于 变量 ， 也 适用 于 函数 。 如 果 函 数 f 需 要 调用 男 一 个 函 
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数 g， 而 且 只 有 函数 {需要 调用 函数 g， 我 们 可 以 把 函数 人 与 函数 g 都 放 到 同一 个 
源 文件 中 ， 并 且 声 明 消 数 g 为 static: 


static int 


glint xy) 
{ 
/* 台 函 数 体 */ 
} 
void f() { 
{ 
/* 其 他 内 容 */ 
b = g(a}; 


} 


我 们 可 以 在 多 个 源 文件 中 定义 同名 的 函数 g， 只 要 所 有 的 函数 g 都 被 定义 为 
static, 或 者 仅仅 只 有 其 中 一 个 函数 g 不 是 static。 因 此 , 为 了 避免 可 能 出 现 的 命名 
冲突 ， 如 果 一 个 函数 仅仅 被 同一 个 源 文件 中 的 其 他 函数 调用 ， 我 们 就 应 该 声明 该 
函数 为 static。 


4.4 ” 形 参 、 实 参与 返回 值 


任何 C 函数 都 有 一 个 形 参 列表 ， 列 表 中 的 每 个 参数 都 是 一 个 变量 ， 该 变量 在 
函数 调用 过 程 中 被 初始 化 。 下 面 这 个 函数 有 一 个 整 型 形 参 ; 
int 
abs (int n) 
{ 
return n<0? -n: n; 


3 


而 对 某 些 函数 来 说 ， 形 参 列表 为 空 。 例 如 ， 
void 
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eat1linet) 
{ 

int Cs 

do c = getchar{}; 

while (c != EOF && ¢ != '\n'); 
} 


函数 调用 时 ， 调 用 方 将 实 参 列 表 传递 给 被 调 函 数 。 在 下 面 的 例子 中 ，a -b 是 
传递 给 函数 abs 的 实 参 : 
if (abs{a - b) > n) 


printf ("difference is out of range\n"); 


一 个 函数 如 果 形 参 列表 为 空 ， 在 被 调用 时 实 参 列表 也 为 空 。 例 如 ， 
eatline{): 


任何 一 个 C 函数 都 有 返回 类 型 ， 要 么 是 void， 要 么 是 函数 生成 结果 的 类 型 。 
函数 的 返回 类 型 理解 起 来 要 比 参数 类 型 相对 容易 一 些 ， 因 此 我 们 将 首先 讨论 它 。 


如 果 任 何 一 个 函数 在 调用 它 的 每 个 文件 中 ， 都 在 第 一 次 被 调用 之 前 进行 了 声 
明 或 定义 ， 那 么 就 不 会 有 任何 与 返回 类 型 相关 的 麻烦 。 例 如 ， 考 虑 下 面 的 例子 ， 
函数 square 计算 它 的 双 精 度 类 型 参数 的 平方 值 : 


double 
square (double x}) 
{ 


return x*x; 
} 
以 及 ， 一 个 调用 square 函数 的 程序 : 
main() 
{ 
printf("%g\n", square{(0.3)}); 
} 
要 使 这 个 程序 能 够 运行 ， 函 数 square 必须 要 么 在 main 之 前 进行 定义 : 
double 
Square (double x) 
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return xXx*x; 


main(} 
{ 
printf("%g\n", square(0.3)); 
} 
要 么 在 main 之 前 进行 声明 : 


double square (double); 


maint) 
{ 
printf("%$g\n", square(0.3)}); 


double 
square (double x) 
| 
return x*x; 


} 


如 果 一 个 函数 在 被 定义 或 声明 之 前 被 调用 , 那么 它 的 返回 类 型 就 默认 为 整 型 。 
上 面 的 例子 中 ， 如 果 将 main 函数 单独 抽取 出 来 作为 一 个 源 文件 : 
main() 
{ 
printf("%g\n", square(0.3))}); 
} 


因为 函数 main 假定 函数 square 返回 类 型 为 整 型 ， 而 函数 square 返回 类 型 实际 上 
是 双 精 度 类 型 ， 当 它 与 square 函数 连接 时 就 会 得 出 错误 的 结果 。 


如 果 我 们 需要 在 两 个 不 同 的 文件 中 分 别 定义 函数 main 与 函数 square, 那么 应 
该 如 何 处 理 呢 ? 函数 square 只 能 有 一 个 定义 。 如 果 square 的 调用 与 定义 分 别 位 于 
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不 同 的 文件 中 ， 那 么 我 们 必须 在 调用 它 的 文件 中 声明 square 函数 : 


double square(double); 


main(} 
{ 
printf("%g\n", square(0.3)); 


C 语言 中 形 参与 实 参 匹 配 的 规则 稍微 有 一 点 复杂 。 ANSIC 允许 程序 员 在 声明 
时 指定 函数 的 参数 类 型 
double square (double},; 
上 面 的 语句 说 明 函 数 square 接受 一 个 双 精 度 类 型 的 参数 ， 返 回 一 个 双 精 度 类 型 的 
结果 。 根 据 这 个 声明 ，square(2) 是 合法 的 ， 整数 2 将 会 被 自动 转换 为 双 精 度 类 型 ， 
就 好 像 程 序 员 写 成 square((double)2) 或 者 square(2.0) 一 样 。 


如 果 一 个 函数 没有 float、short 或 者 char 类 型 的 参数 ， 在 函数 声明 中 完全 可 
以 省 略 参数 类 型 的 说 明 (注意 ， 函 数 定义 中 不 能 省 略 参 数 类 型 的 说 明 )。 因 此 ， 即 
使 是 在 ANSIC 中 ， 像 下 面 这 样 声明 square 函数 也 是 可 以 的 ; 


double square() 


这 样 做 依赖 于 调用 者 能 够 提供 数目 正确 且 类 型 恰当 的 实 参 。 这 里 “恰当 ”并 
不 就 意味 着 “等 同 ?: float 类 型 的 参数 会 自动 转换 为 double 类 型 ，short 或 char 类 
型 的 参数 会 自动 转换 为 int 类 型 。 例 如 ， 对 于 下 面 的 函数 ， 

int 

isvowel (char c) 

{ 

return C == 'a' || c=='e' || cc == 'i' || 


GE 


因为 其 形 参 为 char 类 型 ， 所 以 在 调用 该 函数 的 其 他 文件 中 必须 声明 : 


int isvowel (char); 
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否则 ， 调 用 者 将 把 传递 给 isvowel 函数 的 实 参 自动 转换 为 int 类 型 ， 这 样 就 与 
形 参 类 型 不 一 致 了 。 如 果 函 数 isvowel 是 这 样 定义 的 : 
int isvowel (int c) { 


return c == 'a || c==- 'e' Jlc== 'i' || 


} 


那么 调用 者 就 无 需 进行 声明 ， 即 使 调用 者 在 调用 时 传递 给 isvowel 函数 一 个 char 
类 型 的 参数 也 是 如 此 。 


ANSI C 标准 发 布 之 前 出 现 的 C 编译 器 ， 并 不 都 支持 这 种 风格 的 声明 。 当 我 
们 使 用 这 类 编译 器 时 ， 有 必要 如 下 声明 isvowel 函数 : 

int isvowel(}); 
以 及 这 样 定义 它 : 

int isvowel{c) 


char c; 


] 


为 了 与 早期 的 用 法 兼容 ，ANSI C 也 支持 这 种 较 “ 老 ”形式 的 声明 和 定义 。 这 
就 带 来 一 个 问题 ， 如 果 一 个 文件 中 调用 了 isvowel 函数 ， 却 又 不 能 声明 它 的 参数 
类 型 (为 了 能 够 在 较 “ 老 ”的 编译 器 上 工作 )， 那 么 编译 器 如 何 知 道 函数 形 参 是 
char 类 型 而 不 是 int 类 型 的 呢 ? 答案 在 于 ， 新 旧 两 种 不 同 的 函数 定义 形式 ， 代 表 
不 同 的 含义 。 上 面 isvowel 函数 的 最 后 一 个 定义 ， 实 际 上 相当 于 : 

int 

isvowel {int i) 

{ 

char C = i; 


return C == 'a' ||C== 'e' || c== ' || 
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} 


现在 我 们 已 经 了 解 了 函数 定义 与 声明 的 有 关 细 节 ， 再 来 看 看 这 方面 容易 出 错 
的 一 些 方式 。 下 面 这 个 程序 虽然 简单 ， 却 不 能 运行 ; 
main() 
{ 
double s; 
s = sqrt(2); 
printf ("%g\n", s); 
} 


原因 有 两 个 :第 一 个 原因 是 ，sqrt 函数 本 应 接受 一 个 双 精 度 值 为 实 参 ， 而 实 
际 上 却 被 传递 了 一 个 整 型 参数 ， 第 二 个 原因 是 ，sqrt 函数 的 返回 类 型 是 双 精 度 类 
型 ， 但 却 并 没有 这 样 声 明 。 

一 种 更 正方 式 是 : 


double sqrt (double)}); 


main() 
{ 
double s; 
s = sqrt (2); 
printf{"%g\n", s); 
} 


车 用 另 一 种 方式 ， 则 更 正 后 的 程序 可 以 在 ANSI C 标准 发 布 之 前 就 存在 的 C 


Gouble sqrt () : 


main() 
{ 
double s; 


S = sqrt(2.0);，; 
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printf("%g\n", 8s); 
} 


当然 ， 最 好 的 更 正方 式 是 这 样 : 


#include <math.h> 


main(} 
{ 
double s; 
Ss = sqrt(2.0); 
printf("%g\n", s); 
} 


这 个 程序 看 上 去 并 没有 显 式 地 说 明 sqrt 函数 的 参数 类 型 与 返回 类 型 ， 但 实际 
上 它 从 系统 头 文件 math.h 中 获得 了 这 些 信息 。 尽 管 本 例 中 为 了 与 早期 C 编译 器 兼 
容 , 已 经 把 实 参 写成 了 双 精 度 类 型 的 2.0 而 不 是 整 型 的 2, 然而 即使 仍然 写作 整 型 
的 2, 在 符合 ANSIC 标准 的 编译 器 上 , 这 个 程序 也 能 确保 实 参 会 被 转换 为 恰当 的 
类 型 。 

因为 函数 printf 与 函数 scanf 在 不 同情 形 下 可 以 接受 不 同类 型 的 参数 , 所 以 它 
们 特别 容易 出 错 。 这 里 有 一 个 值得 注意 的 例子 : 


#include <stdio.h> 
main() 
{ 
Erit:; dy 
char c; 
for (i = 0; i < 5; i++) { 
scanf{"%d", &c); 
printf("%d ", i); 
} 
printf("\n"); 
} 


表面 上 , 这 个 程序 从 标准 输入 设备 读 入 5 个 数 , 在 标准 输出 设备 上 写 5 个 数 : 
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0 1 2 34 
实际 上 ， 这 个 程序 并 不 一 定 得 到 上 面 的 结果 。 例 如 ， 在 某 个 编译 器 上 ， 它 的 输出 
是 

000001234 

为 什么 呢 ? 问题 的 关键 在 于 ， 这 里 c 被 声明 为 char 类 型 ， 而 不 是 int 类 型 。 
当 程 序 要 求 scanf 读 入 一 个 整数 ， 应 该 传递 给 它 一 个 指向 整数 的 指针 。 而 程序 中 
scanf 函数 得 到 的 却 是 一 个 指向 字符 的 指针 ，scanf 函数 并 不 能 分 辩 这 种 情况 ， 它 
只 是 将 这 个 指向 字符 的 指针 作为 指向 整数 的 指针 而 接受 ， 并 且 在 指针 指向 的 位 置 
存储 一 个 整数 。 因 为 整数 所 占 的 存储 空间 要 大 于 字符 所 占 的 存储 空间 ， 所 以 字符 
c 附近 的 内 存 将 被 覆盖 。 

字符 c 附近 的 内 存 中 存储 的 内 容 是 由 编译 器 决定 的 ， 本 例 中 它 存放 的 是 整数 
i 的 低 端 部 分 。 因 此 ， 每 次 读 入 一 个 数值 到 c 时 ， 都 会 将 i 的 低 端 部 分 覆盖 为 0， 
而 i 的 高 端 部 分 本 来 就 是 0， 相 当 于 i 每 次 被 重新 设置 为 0， 循环 将 一 直 进行 。 当 
到 达 文 件 的 结束 位 置 后 ，scanf 函数 不 再 试图 读 入 新 的 数值 到 c。 这 时 ，i 才 可 以 
正常 地 递增 ， 最 后 终止 循环 。 


4.5 检查 外 部 类 型 


假定 我 们 有 一 个 C 程序 ， 它 由 两 个 源 文件 组 成 。 一 个 文件 中 包含 外 部 变量 n 
的 声明 : 

extern int n; 

另 一 个 文件 中 包含 外 部 变量 n 的 定义 : 

long n; 

这 里 假定 两 个 语句 都 不 在 任何 一 个 函数 体内 ， 因 此 n 是 外 部 变量 。 

这 是 一 个 无 效 的 C 程序 ， 因为 同一 个 外 部 变量 名 在 两 个 不 同 的 文件 中 被 声明 
为 不 同 的 类 型 。 然 而 ， 大 多 数 C 语言 实现 却 不 能 检测 出 这 种 错误 。 编 译 器 对 这 两 
个 不 同 的 文件 分 别 进 行 处 理 ， 这 两 个 文件 的 编译 时 间 甚 至 可 以 相差 好 儿 个 月 。 因 
此 ， 编 译 器 在 编译 一 个 文件 时 ， 并 不 知道 另 一 个 文件 的 内 容 。 连 接 器 可 能 对 C 语 
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言 一 无 所 知 ， 因 此 它 也 不 知道 如 何 比较 两 个 n 的 定义 中 的 类 型 。 

当 这 个 程序 运行 时 ， 究 竟 会 发 生 什 么 情况 呢 ? 存在 很 多 的 可 能 情况 ， 

1.C 语言 编译 器 足够 “聪明 ”， 能 够 检测 到 这 一 类 型 冲突 。 编 程 者 将 会 得 到 一 
条 诊断 消息 ， 报 告 变量 n 在 两 个 不 同 的 文件 中 被 给 定 了 不 同 的 类 型 。 

2. 读者 使 用 的 C 语言 实现 对 int 类 型 的 数值 与 long 类 型 的 数值 在 内 部 表示 上 
是 一 样 的 。 尤 其 是 在 32 位 计算 机 上 ， 一般 都 是 如 此 处 理 。 在 这 种 情况 下 ,程序 很 
可 能 正常 工作 ， 就 好 像 n 在 两 个 文件 中 都 被 声明 为 ong 或 int) 类 型 一 样 。 本 来 
错误 的 程序 因为 某 种 巧合 却 能 够 工作 ， 这 是 一 个 很 好 的 例子 。 

3. 变量 n 的 两 个 实例 虽然 要 求 的 存储 空间 的 大 小 不 同 , 但 是 它们 共享 存储 空 
间 的 方式 却 恰好 能 够 满足 这 样 的 条 件 : 赋 给 其 中 一 个 的 值 , 对 另 一 个 也 是 有 效 的 。 
这 是 有 可 能 发 生 的。 举例 来 说 ， 如 果 连 接 器 安排 int 类 型 的 n 与 long 类 型 的 n 的 
低 端 部 分 共享 存储 空间 ， 这 样 给 每 个 long 类 型 的 n 赋值 ， 恰 好 相当 于 把 其 低 端 部 
分 赋 给 了 int 类 型 的 n。 本 来 错误 的 程序 因为 某 种 巧合 却 能 够 工作 ， 这 是 一 个 比 第 
2 种 情况 更 能 说 明 问 题 的 例子 。 


4. 变量 n 的 两 个 实例 共享 存储 空间 的 方式 ， 使 得 对 其 中 一 个 赋值 时 ， 其 效果 
相当 于 同时 给 另 一 个 赋 了 完全 不 同 的 值 。 在 这 种 情况 下 ， 程 序 将 不 能 正常 工作 。 

因此 , 保证 一 个 特定 名 称 的 所 有 外 部 定义 在 每 个 目标 模块 中 都 有 相同 的 类 型 ， 
一 般 来 说 是 程序 员 的 责任 。 而且“ 相同 的 类 型 ”应 该 是 严格 意义 上 的 相同 。 例 如 ， 
考虑 下 面 的 程序 ， 在 一 个 文件 中 包含 定义 : 

char filename[] = "/etc/passwa"; 
而 在 男 一 个 文件 中 包含 声明 : 

extern char* filename; 

尽管 在 某 些 上 下 文 环境 中 ， 数 组 与 指针 非常 类 似 ， 但 它们 毕竟 不 同 。 在 第 一 
个 声明 中 ，filename 是 一 个 字符 数组 的 名 称 。 尽 管 在 一 个 语句 中 引用 filename 的 
值 将 得 到 指向 该 数组 起 始 元 素 的 指针 , 但 是 flename 的 类 型 是 “字符 数组 ”而 不 
是 “字符 指针 ” 在 第 二 个 声明 中 , filename 被 确定 为 一 个 指针 。 这 两 个 对 filename 
的 声明 使 用 存储 空间 的 方式 是 不 同 的 ， 它 们 无 法 以 一 种 合乎 情理 的 方式 共存 。 第 
一 个 例子 中 字符 数组 和 ename 的 内 存 布局 大 致 如 图 4.1 所 示 。 
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filename 


图 4.1 字符 数组 filename 的 内 存 布局 示意 图 


第 二 个 例子 中 字符 指针 filename 的 内 存 布局 大 致 如 图 4.2 所 示 。 


filename 





4.2 字符 指针 filename 的 内 存 布局 示意 图 


要 更 正本 例 ， 应 该 改变 fllename 的 声明 或 定义 中 的 一 个 ， 使 其 与 男 一 个 类 型 
匹配 。 因 此 ， 既 可 以 是 如 下 改 法 : 


char filename[] = "/etc/passwd"; /* 文件 1 */ 

extern char filename[]; /* 文件 2 */ 
也 可 以 是 这 种 改 法 : 

char* filename = "/etc/passwd"; /* 文件 1 */ 

extern char* filename; /* 文件 2 */ 


有 关外 部 类 型 方面 ， 另 一 种 容易 带 来 麻烦 的 方式 是 忽略 了 声明 函数 的 返回 类 
型 ， 或 者 声明 了 错误 的 返回 类 型 。 例 如 ， 回 顾 一 下 我 们 在 4.4 节 中 讨论 的 程序 : 


maint() 
{ 
double s; 
S = sqrt(2); 
printfl"%g\n", s); 
} 


这 个 程序 没有 包括 对 函数 sqrt 的 声明 ， 因 而 函数 sqrt 的 返回 类 型 只 能 从 上 下 
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文 进行 推断 。C 语言 中 的 规则 是 ， 如 果 一 个 未 声明 的 标识 符 后 跟 一 个 开 括号 ， 那 
么 它 将 被 视 为 一 个 返回 整 型 的 函数 。 因 此 ， 这 个 程序 完全 等 同 于 下 面 的 程序 


extern int SGLtL() 


maint{) 
{ 
double s; 
s = sqrt(2); 
printf("%g\n", s); 
} 


当然 ， 这 种 写法 是 错误 的 。 函 数 sqrt 返回 双 精 度 类 型 ， 而 不 是 整 型 。 因 此 ， 
这 个 程序 的 结果 是 不 可 预测 的 。 事 实 上 ， 该 程序 似乎 能 够 在 某 些 机 器 上 工作 。 举 
例 来 说 ， 假 定 有 这 样 一 种 机 器 ， 无 论 函 数 的 返回 值 是 整 型 值 还 是 浮 点 值 ， 它 都 使 
用 同样 的 寄存 器 。 这 样 的 计算 机 ， 将 直接 把 函数 sqrt 的 返回 结果 按 其 二 进 制 表示 
的 各 个 位 传递 给 函数 printf， 而 并 不 去 检查 类 型 是 否 一 致 。 函 数 printf 得 到 了 正确 
的 一 进 制 表示 ， 当 然 能 够 打印 出 正确 的 结果 。 某 些 机 器 在 不 同 的 寄存 器 中 存储 整 
数 与 指针 。 在 这 样 的 机 器 上 ， 即 使 不 牵涉 到 浮 点 运算 ， 这 种 类 型 的 错误 也 仍然 可 
能 造成 程序 失败 。 


4.6” 头 文件 


有 一 个 好 方法 可 以 避免 大 部 分 此 类 问题 ， 这 个 方法 只 需要 我 们 接受 一 个 简单 
的 规则 ， 每 个 外 部 对 象 只 在 一 个 地 方 声明 。 这 个 声明 的 地 方 一 般 就 在 一 个 头 文件 
中 ,需要 用 到 该 外 部 对 象 的 所 有 模块 都 应 该 包括 这 个 头 文件 。 特别 需要 指出 的 是 ， 
定义 该 外 部 对 象 的 模块 也 应 该 包括 这 个 头 文件 。 


例如 ， 再 来 看 前 面 讨论 过 的 flename 例子 。 这 个 例子 可 能 是 一 个 完整 程序 的 
一 部 分 ， 生生 UL es 一 
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extern char filename[]: 

需要 用 到 外 部 对 象 ilename 的 每 个 C 源 文件 都 应 该 加 上 这 样 一 个 语句 : 

#include "file.h" 

最 后 ， 我 们 选择 一 个 C 源 文件 ， 在 其 中 给 出 锯 ename 的 初始 值 。 我 们 不 妨 称 
这 个 文件 为 file.c: 


#include "file.h" 


char filename[] = "/etc/passwad"; 


注意 ， 源 文件 file.c 实际 上 包含 filename 的 两 个 声明 ， 这 一 点 只 要 把 include 
语句 展开 就 可 以 看 出 : 

extern char filenamel{]; 

char filename[] = "/etc/passwd"; 

只 要 源 文件 file.c 中 filename 的 各 个 声明 是 一 致 的 ， 而 且 这 些 声 明 中 最 多 只 
有 一 个 是 flename 的 定义 ， 这 样 写 就 是 合法 的 。 

让 我 们 来 看 这 样 做 的 效果 。 头 文件 file.h 中 声明 了 filename 的 类 型 ， 因 此 每 
个 包含 了 file.h 的 模块 也 就 自动 地 正确 声明 了 flename 的 类 型 。 源 文件 file.c 定义 
了 filename， 由 于 它 也 包含 了 file.h 头 文件 ， 因 此 filename 定义 的 类 型 自动 地 与 声 
明 的 类 型 相符 合 。 如 果 编 译 所 有 这 些 文件 ，filename 的 类 型 就 表 定 是 正确 的 ! 

练习 4-1。 假定 一 个 程序 在 一 个 源 文件 中 包含 了 声明 : 

long foo; 
而 在 另 一 个 源 文件 中 包含 了 : 

extern short foo; 

又 进一步 假定 ， 如 果 给 long 类 型 的 foo 赋 一 个 较 小 的 值 , 例如 37, 那么 short 
类 型 的 foo 就 同时 获得 了 一 个 值 37。 我 们 能 够 对 运行 该 程序 的 硬件 作出 什么 样 的 
推断 ? 如 果 short 类 型 的 foo 得 到 的 值 不 是 37 而 是 0， 我 们 又 能 够 作出 什么 样 的 
推断 ? 

练习 4-2， 本 章 第 4 节 中 讨论 的 错误 程序 ， 经 过 适当 简化 后 如 下 所 示 : 


#include <stdio.h> 
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maint() 
{ 
printf("%g\n", sart (2));} 


在 某 些 系统 中 ， 打 印 出 的 结果 是 


gg 
请 问 这 是 为 什么 ? 


82 





入 
昔 


库 消 数 





C 语言 中 没有 定义 输入 /输出 语句 , 任何 一 个 有 用 的 C 程序 (起码 必须 接受 零 
个 或 多 个 输入 ， 生 成 一 个 或 多 个 输出 ) 都 必须 调用 库 消 数 米 完成 最 基本 的 输入 / 
输出 操作 。ANSIC 标准 毫 无 疑问 地 意识 到 了 这 一 点 , 因而 定义 了 一 个 包含 大 量 标 
准 库 函 数 的 集合 。 从 理论 上 说 , 任何 一 个 C 语言 实现 都 应 该 提供 这 些 标 准 库 函 数 。 
ANSI C 中 定义 的 标准 库 函 数 集合 并 不 完备 。 例 如 ， 基 本 上 所 有 的 C 语音 实现 都 
包括 了 执行 “底层 ”IO 操作 的 read 和 write 函数 ， 但 是 这 些 函 数 却 并 没有 出 现在 
ANSI C 标准 中 。 而 且 ， 并 非 所 有 的 C 语言 实现 都 包括 了 全 部 的 标准 库 函 数 。 毕 
竟 ，ANSI C 标准 还 是 一 个 新 生 事 物 。 


译注 : 根据 序言 中 的 说 明 ， 作 者 写作 本 书 时 ANSIC 标准 尚 没有 最 后 定案 。 





大 多 数 库 函 数 的 使 用 都 不 会 有 什么 麻烦 ， 它 们 的 意义 和 用 法 明白 而 直接 ， 程 
序 员 大 部 分 时 间 似 乎 都 能 够 正确 地 使 用 它们 。 然 而 ， 也 有 一 些 例外 情形 ， 如 某 些 
经 常用 到 的 库 函数 表现 出 来 的 行为 方式 往往 有 悖 于 使 用 者 的 本 意 。 特 别 地 ， 程 序 
员 似 乎 常常 对 printf 函数 族 ， 以 及 用 于 编写 具有 可 灾 参 数列 表 的 肾 数 的 varargs.h 
的 诸多 细节 感到 丈 手 。 本 书 附录 中 详细 说 明了 这 两 个 工具 , 以 及 stdarg.h (ANSIC 
版 本 的 varargs.h) 工具 。 


有 关 库 函数 的 使 用 ， 我 们 能 给 出 的 最 好 建议 是 尽量 使 用 系统 头 文 件 。 如 果 库 
文件 的 编写 者 已 经 提供 了 精确 描述 库 函 数 的 头 文件 ， 不 去 使 用 它们 就 真是 愚 不 可 
及 。 在 ANSI C 中 这 一 点 尤其 重要 ， 因 为 头 文件 中 包括 了 库 上 男 数 的 参数 类 型 以 及 
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返回 类 型 的 声明 。 事实 上 , 某 些 情况 下 为 了 保证 得 到 正确 的 结果 ,ANSIC 标准 甚 
至 强制 要 求 使 用 系统 头 文件 。 


本 章 剩 下 部 分 将 探讨 某 些 常见 的 库 函 数 ， 以 及 编程 者 在 使 用 它们 的 过 程 中 可 
能 出 错 之 处 。 


5.1 返回 整数 的 getchar 函数 


我 们 首先 考虑 下 面 的 例子 : 


#include <stdio.h> 


char c; 


while (i{c = getchar{)) != EOF) 
putchar (c}; 


} 


getchar 函数 在 一 般 情况 下 返回 的 是 标准 输入 文件 中 的 下 一 个 字符 ， 当 没有 输 
入 时 返回 EOF 一 个 在 头 文件 stdio.h 中 被 定义 的 值 ， 不 同 于 任何 一 个 字符 )。 这 
个 程序 乍 一 看 似乎 是 把 标准 输入 复制 到 标准 输出 ， 实 则 不 然 。 

原因 在 于 程序 中 的 变量 c 被 声明 为 char 类 型 ， 而 不 是 int 类 型 。 这 意味 着 c 
无 法 容 下 所 有 可 能 的 字符 ， 特 别 是 ， 可 能 无 法 容 下 EOF。 

因此 ， 最 终结 果 存 在 两 种 可 能 。 一 种 可 能 是 ， 某 些 合 法 的 输入 字符 在 被 “ 截 
断 ” 后 使 得 c 的 取 值 与 EOF 相同 ; 另 一 种 可 能 是 , c 根本 不 可 能 取 到 EOF 这 个 值 。 
对 于 前 一 种 情况 ， 程 序 将 在 文件 复制 的 中 途 终止 ， 对 于 后 一 种 情况 ， 程 序 将 陷入 
一 个 死 循环 。 

实际 上 ， 还 有 可 能 存在 第 三 种 情况 ,程序 表 面 上 似乎 能 够 正常 工作 ， 但 完全 
是 因为 巧合 。 尽管 函数 getchar 的 返回 结果 在 赋 给 char 类 型 的 变量 c 时 会 发 生 “ 截 
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断 ” 操 作 ， 尽 管 while 语句 中 比较 运算 的 操作 数 不 是 函数 getchar 的 返回 值 ， 而 是 
被 “截断 ”的 值 c， 然 而 令 人 惊讶 地 是 许多 编译 器 对 上 述 表 达 式 的 实现 并 不 正确 。 
这 些 编译 器 确实 对 函数 getchar 的 返回 值 作 了 “截断 ”处 理 ， 并 把 低 端 字 节 部 分 赋 
给 了 变量 c。 但 是 ， 它 们 在 比较 表达 式 中 并 不 是 比较 与 EOF， 而 是 比较 getchar 
函数 的 返回 值 与 EOF! 编译 器 如 果 采 取 的 是 这 种 做 法 ， 上 面 的 例子 程序 看 上 去 就 
能 够 “正常 ”运行 了 。 


$5.2 更 新 顺序 文件 


许多 系统 中 的 标准 输入 /输出 库 都 允许 程序 打开 一 个 文件 , 同时 进行 写 入 和 读 
出 的 操作 : 


FILE *fp; 

fp = fopen(file, "r+"); 

上 面 的 例子 代码 打开 了 文件 名 由 变量 file 指定 的 文件 ， 对 于 存 取 权限 的 设 定 
表明 程序 希望 对 这 个 文件 进行 输入 和 输出 操作 。 


编程 者 也 许 认 为 ， 程 序 一 旦 执行 上 述 操作 完毕 ， 就 可 以 自由 地 交错 进行 读 出 
和 写 入 的 操作 。 遗 憾 的 是 ， 事 实 总 难 遂 人 所 愿 ， 为 了 保持 与 过 去 不 能 同时 进行 读 
写 操作 的 程序 的 向 下 兼容 性 ， 一 个 输入 操作 不 能 随后 直接 紧 跟 一 个 输出 操作 ， 反 
之 亦 然 。 如 果 要 同时 进行 输入 和 输出 操作 ， 必 须 在 其 中 插入 fseek 函数 的 调用 。 


下 面 的 程序 片段 似乎 更 新 了 一 个 顺序 文件 中 选 定 的 记录 : 


FILE *fp; 


struct record rec; 


while (fread( (char *)&rec, sizeof(rec), 1, fp) == 1) { 
/* 对 rec 执行 某 些 操作 */ 
if (/* rec 必须 被 重新 写 入 */) { 
fseek(fp, - (long)sizeof (rec}, 1); 


fwrite( (char *)&rec, sizeof(rec), 1, fp); 
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这 段 代码 乍 看 上 去 毫 无 问题 : &rec 在 传 入 fread 和 fwrite 函数 时 被 小 心 翼 翼 
地 转换 为 字符 指针 类 型 ，sizeof(rec) 被 转换 为 长 整 型 (fseek 函数 要 求 第 二 个 参数 
是 long 类 型 ,因为 int 类 型 的 整数 可 能 无 法 包含 一 个 文件 的 大 小 ; sizeof 返回 一 个 
unsigned 值 ， 因 此 首先 必须 将 其 转换 为 有 符号 类 型 才 有 可 能 将 其 反 号 )。 但 是 这 段 
代码 仍然 可 能 运行 失败 ， 而 且 出 错 的 方式 非常 难于 察觉 。 
问题 出 在 : 如 果 一 个 记录 需要 被 重新 写 入 文件 ， 也 就 是 说 ，fwrite 函数 得 到 
执行 ， 对 这 个 文件 执行 的 下 一 个 操作 将 是 循环 开始 的 fread 函数 。 因 为 在 fwrite 
函数 调用 与 fread 函数 调用 之 间 缺 少 了 一 个 fseek 函数 调用 ， 所 以 无 法 进行 上 述 操 
作 。 解 决 的 办 法 是 把 这 段 代 码 改写 为 ; 
while (fread( (char *)g&rec, sizeof (rec), 1, fp) == 1) { 
/* 对 rec 执行 某 些 操作 */ 
if (/* rec 必须 被 重新 写 入 */) { 
fseek(fp, -(long)sizeof (rec}, 1); 
fwrite{ {char *)&rec, sizeof (rec), 1, fp); 


fseek(fp, OL, 1); 


第 二 个 fseek 辫 数 虽然 看 上 去 什么 也 没 做 ， 但 它 改变 了 文件 的 状态 ， 使 得 文 
件 现 在 可 以 正常 地 进行 读 取 了 。 


s.3 缓冲 输出 与 内 存 分 配 


当 一 个 程序 生成 输出 时 ， 是 否 有 必要 将 输出 立即 展示 给 用 户 ? 这 个 问题 的 答 
案 根 据 不 同 的 程序 而 定 。 

例如 ， 假 设 一 个 程序 输出 到 终端 ， 向 终端 前 的 用 户 提 问 ， 要 求 用 户 回答 ， 那 
么 为 了 让 用 户 知道 应 该 键入 什么 内 容 ， 程 序 输出 应 该 即时 地 显示 给 用 户 。 另 一 种 
情况 是 ， 假 设 一 个 程序 输出 到 一 个 文件 ， 然 后 输出 到 一 个 行 式 打 印 机 ， 那 么 只 要 
程序 结果 最 后 都 全 部 输出 到 了 目标 《文件 或 打印 机 ) 就 可 以 了 。 
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程序 输出 有 两 种 方式 ， 一 种 是 即时 处 理 方式 ， 另 一 种 是 先 暂 存 起 来 ， 然 后 再 
大 块 写 入 的 方式 ， 前 者 往往 造成 较 高 的 系统 负担 。 因 此 ，C 语言 实现 通常 都 允许 
程序 员 进行 实际 的 写 操作 之 前 控制 产生 的 输出 数据 量 。 

这 种 控制 能 力 一 般 是 通过 库 函 数 setbuf 实现 的 。 如 果 buf 是 一 个 大 小 适当 的 
字符 数组 ， 那 么 

setbuf (stdout, buf)}); 

语句 将 通知 输入 /输出 库 ， 所 有 写 入 到 stdout 的 输出 都 应 该 使 用 buf 作为 输出 
缓冲 区 ， 直 到 buf 缓冲 区 被 填 满 或 者 程序 员 直 接 调用 fflush (译注: 对 于 出 写 操作 
打开 的 文件 ， 调 用 fflush 将 导致 输出 缓冲 区 的 内 容 被 实际 地 写 入 该 文件 )，buf 组 
冲 区 中 的 内 容 才 实 际 写 入 到 stdout 中 。 缓 冲 区 的 大 小 由 系统 头 文件 <stdio.h> 中 的 
BUFSIZ 定义 。 


下 面 的 程序 的 作用 是 把 标准 输入 的 内 容 复 制 到 标准 输出 中 ， 演 示 了 setbuf 库 
函数 最 显而易见 的 用 法 ， 


#include <stdio.h> 


maint{) 
{ 


yo 


char buf [BUFSIZ}; 
setbuf (stdout, buf),; 


while ((c = getchar(}) != EOF) 
putchar{(c}); 
} 


遗憾 的 是 ， 这 个 程序 是 错误 的 ， 仅 仅 是 因为 一 个 细微 的 原因 。 程 序 中 对 库 函 
数 setbuf 的 调用 ,通知 了 输入 /输出 库 所 有 字符 的 标准 输出 应 该 首先 缓存 在 buf 中 。 
要 找到 问题 出 自 何 处 ， 我 们 不 妨 思考 一 下 buf 缓冲 区 最 后 一 次 被 清空 是 在 什么 时 
候 ? 答案 是 在 main 函数 结束 之 后 ， 作 为 程序 交 回 控制 给 操作 系统 之 前 C 运行 时 
库 所 必须 进行 的 清理 工作 的 一 部 分 。 但 是 ， 在 此 之 前 buf 字符 数组 已 经 被 释放 ! 
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要 避免 这 种 类 型 的 错误 有 两 种 办 法 。 第 一 种 办 法 是 让 缓冲 数组 成 为 静态 数组 ， 
既 可 以 直接 显 式 声明 buf 为 静态 : 

static char buf [BUFSIZ}; 

也 可 以 把 buf 声明 完全 移 到 main 函数 之 外 。 第 二 种 办 法 是 动态 分 配 缓冲 区 ， 在 程 
序 中 并 不 主动 释放 分 配 的 缓冲 区 《〈 详 注 : 由 于 缓冲 区 是 动态 分 配 的 ， 所 以 main 
函数 结束 时 并 不 会 释放 该 缓冲 区 ， 这 样 C 运行 时 库 进行 清理 工作 时 就 不 会 发 生 组 
冲 区 已 释放 的 情况 ): 

char *malloc(); 

setbuf (stdout, malloc (BUFSIZ)); 

如 果 读 者 关心 一 些 编程 “小 技巧 ” 也 许 会 注意 到 这 里 其 实 并 不 需要 检查 
malloc 函数 调用 是 否 成 功 。 如 果 malloc 函数 调用 失败 , 将 返回 一 个 null 指针 。setbuf 
函数 的 第 二 个 参数 取 值 可 以 为 null， 此 时 标准 输出 不 需要 进行 缓冲 。 这 种 情况 下 ， 
程序 仍然 能 够 工作 ， 只 不 过 速度 较 慢 而 已 。 


S.4 使 用 errno 检测 错误 


很 多 库 函 数 ， 特 别 是 那些 与 操作 系统 有 关 的 ， 当 执行 失败 时 会 通过 -- 个 名 称 
为 errno 的 外 部 变量 ， 通 知 程序 该 函数 调用 失败 。 下 面 的 代码 利用 这 一 特性 进行 
错误 处 理 ， 似 乎 再 清楚 明白 不 过 ， 然 而 却 是 错误 的 : 

/* 调用 库 函 数 */ 

if {errno) 


/* 处 理 错误 */ 


出 错 原 因 在 于 ， 在 库 函 数 调用 没有 失败 的 情况 下 ， 并 没有 强制 要 求 库 函 数 一 
定 要 设置 errno 为 0, 这 样 errno 的 值 就 可 能 是 前 一 个 执行 失败 的 库 函数 设置 的 值 。 
下 面 的 代码 作 了 更 正 ， 似 乎 能 够 工作 ， 很 可 惜 还 是 错误 的 : 

errno = 0; 

/* 调用 库 函 数 */ 


if (errno)} 
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/* 处 理 错误 */ 

库 函 数 在 调用 成 功 时 ， 既 没有 强制 要 求 对 ermo 清 零 ， 但 同时 也 没有 禁止 设 
置 ermo。 既 然 库 消 数 已 经 调用 成 功 ， 为 什么 还 有 可 能 设置 errno 呢 ? 要 理解 这 一 
点 ， 我 们 不 妨 假 想 一 下 库 函 数 fopen 在 调用 时 可 能 会 发 生 什么 情况 。 当 fopen 函 
数 被 要 求 新 建 一 个 文件 以 供 程序 输出 时 ， 如 果 已 经 存在 一 个 同名 文件 ，fopen 函 
数 将 先 删 除 它 ， 然 后 新 建 一 个 文件 。 这 样 ，fopen 函数 可 能 需要 调用 其 他 的 库 函 
数 ， 以 检测 同名 文件 是 否 已 经 存在 。( 译 注 ; 假设 用 于 检测 文件 的 库 函 数 在 文件 不 
存在 时 ， 会 设置 ermo。 那 么 ，fopen 函数 每 次 新 建 一 个 事先 并 不 存在 的 文件 时 ， 
即使 没有 任何 程序 错误 发 生 ，ermo 也 仍然 可 能 被 设置 。) 

因此 ， 在 调用 库 函 数 时 ， 我 们 应 该 首先 检测 作为 错误 指示 的 返回 值 ， 确 定 程 
序 执行 已 经 失败 。 然 后 ， 再 检查 errno， 来 搞 清楚 出 错 原因 ， 

/* 调用 库 浮 数 */ 

if (返回 的 错误 值 ) 

检查 errno 


s.S” 库 函数 signal 


实际 上 所 有 的 C 语言 实现 中 都 包括 有 signal 库 函 数 ， 作 为 捕获 异步 事件 的 一 
种 方式 。 要 使 用 该 库 函 数 ， 需 要 在 源 文 件 中 加 上 

#include <signal.h> 
以 引入 相关 的 声明 。 要 处 理 一 个 特定 的 signal (信号 )， 可 以 这 样 调用 signal 函数 : 

signal (signal type, handler function); 
这 里 的 signal type 代表 系统 头 文件 signal.h 中 定义 的 某 些 常量 , 这 些 常量 用 来 标识 
signal 函数 将 要 捕获 的 信号 类 型 。 这 里 的 handler function 是 当 指 定 的 事件 发 生 时 ， 
将 要 加 以 调用 的 事件 处 理 函数 。 

在 许多 C 语言 实现 中 ， 信 和 号 是 真正 意义 上 的 “异步 ” 从 理论 上 说 ， 一 个 信 
号 可 能 在 C 程序 执行 期 间 的 任何 时 刻 上 发 生 。 需 要 特别 强调 的 是 ， 信 和 号 甚至 可 能 
出 现在 某 些 复杂 库 函 数 〈 如 malloc) 的 执行 过 程 中 。 因 此 ， 从 安全 的 角度 考虑 ， 
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信和 号 的 处 理 函 数 不 应 该 调用 上 述 类 型 的 库 函 数 。 

例如 ， 假 设 malloc 函数 的 执行 过 程 被 一 个 信号 中 断 。 此 时 ，malloc 函数 用 来 
跟踪 可 用 内 存 的 数据 结构 很 可 能 只 有 部 分 被 更 新 。 如 果 signal 处 理 函 数 再 调用 
malloc 函数 ， 结 果 可 能 是 malloc 函数 用 到 的 数据 结构 完全 朋 泪 ， 后 果 不 堪 设 想 ! 


基于 同样 的 原因 ， 从 signal 处 理 函 数 中 使 用 longjmp 退出 ， 通 常情 况 下 也 是 
不 安全 的 : 因为 信号 可 能 发 生 在 malloc 或 者 其 他 库 函 数 开 始 更 新 某 个 数据 结构 ， 
却 又 没有 最 后 完成 的 过 程 中 。 因 此 ，signal 处 理 函 数 能 够 做 的 安全 的 事情 ， 似 乎 
就 只 有 设置 一 个 标志 然后 返回 ， 期 待 以 后 主 程序 能 够 检查 到 这 个 标志 ， 发 现 一 个 
信和 号 已 经 发 生 。 


然而 ， 就 算 这 样 做 也 并 不 总 是 安全 的 。 当 一 个 算术 运算 错误 (例如 溢出 或 者 
零 作 除数 ) 引发 一 个 信号 时 ， 某 些 机 器 在 signal 处 理 函 数 返 回 后 还 将 重新 执行 失 
败 的 操作 。 而 当 这 个 算术 运算 重新 执行 时 ， 我 们 并 没有 一 个 可 移植 的 办 法 来 改变 
操作 数 。 这 种 情况 下 ， 最 可 能 的 结果 就 是 马上 又 引发 一 个 同样 的 信号 。 因 此 ， 对 
于 算术 运算 错误 ，signal 处 理 函 数 的 惟一 安全 、 可 移植 的 操作 就 是 打印 一 条 出 错 
消息 ， 然 后 使 用 longjmp 或 exit 立即 退出 程序 。 


由 此 ， 我 们 得 到 的 结论 是 : 信和 号 非常 复杂 环 手 ， 而 且 具 有 一 些 从 本 质 上 而 言 
不 可 移植 的 特性 。 解 决 这 个 问题 我 们 最 好 采取 “和 守 势 ” 让 signal 处 理 函 数 尽 可 能 
地 简单 ， 并 将 它们 组 织 在 一 起 。 这 样 ， 当 需要 适应 一 个 新 系统 时 ， 我 们 可 以 很 容 
易 地 进行 修改 。 

练习 5-1. 当 一 个 程序 异常 终止 时 ， 程 序 输 出 的 最 后 几 行 常常 会 丢失 ， 原 因 
是 什么 ? 我 们 能 够 采取 怎样 的 措施 来 解决 这 个 问题 ? 

练习 $5-2， 下面 程序 的 作用 是 把 它 的 输入 复制 到 输出 : 


#include <stdio.h> 
maint{) 
{ 


register int c; 


while {l(c = getchar{)) != EOF) 


putchar (c}; 
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从 这 个 程序 中 去 掉 #include 语句 ， 将 导致 程序 不 能 通过 编译 ， 因 为 这 时 EOF 
是 未 定义 的 。 假 定 我 们 手工 定义 了 EOF〈 当 然 ， 这 是 一 种 不 好 的 做 法 ): 

#define EOF -1 

main{() 


{ 


register int c; 


while ({c = 9etchar()) != EOF) 


putchar (c); 


这 个 程序 在 许多 系统 中 仍然 能 够 运行 ， 但 是 在 某 些 系 统 运 行 起 来 却 慢 得 多 。 
这 是 为 什么 ? 


91 





re 
争 


he 
宣 





预 处 理 剧 





在 严格 意义 上 的 编译 过 程 开 始 之 前 ，C 语言 预 处 理 器 首先 对 程序 代码 作 了 必 
要 的 转换 处 理 。 因 此 ， 我 们 运行 的 程序 实际 上 并 不 是 我 们 所 写 的 程序 。 预 处 理 器 
使 得 编程 者 可 以 简化 某 些 工 作 ， 它 的 重要 性 可 以 由 两 个 主要 的 原因 说 明 (当然 还 
有 一 些 次 要 原因 ， 此 处 就 不 赣 述 了 )。 


第 一 个 原因 是 ， 我 们 也 许 会 遇 到 这 样 的 情况 ， 需 要 将 某 个 特定 数量 《例如 ， 
某 个 数据 表 的 大 小 ) 在 程序 中 出 现 的 所 有 实例 统统 加 以 修改 。 我 们 希望 能 够 通过 
在 程序 中 只 改动 一 处 数值 ， 然 后 重新 编译 就 可 以 实现 。 预 处 理 器 要 做 到 这 一 点 可 
以 说 是 轻而易举 ， 即 使 这 个 数值 在 程序 中 的 很 多 地 方 出 现 。 我 们 只 需要 将 这 个 数 
值 定义 为 一 个 显 式 常量 (manifest constant)， 然 后 在 程序 中 需要 的 地 方 使 用 这 个 
常量 即 可 。 而 且 ， 预 处 理 器 还 能 够 很 容易 地 把 所 有 常量 定义 都 集中 在 一 起 ， 这 样 
要 找到 这 些 常量 也 非常 容易 。 

第 二 个 原因 是 ， 大 多 数 C 语言 实现 在 函数 调用 时 都 会 带 来 重大 的 系统 开销 。 
因此 ， 我 们 也 许 希 望 有 这 样 一 种 程序 块 ， 它 看 上 去 像 一 个 函数 ， 但 却 没 有 函数 调 
用 的 开销 。 举 例 来 说 ，getchar 和 putchar 经 常 被 实现 为 宏 ， 以 避免 在 每 次 执行 输 
入 或 者 输出 一 个 字符 这 样 简单 的 操作 时 ， 都 要 调用 相应 的 函数 而 造成 系统 效率 的 
下 降 。 

虽然 宏 非常 有 用 ， 但 如 果 程 序 员 没 有 认识 到 宏 只 是 对 程序 的 文本 起 作用 ， 那 
么 他 们 很 容易 对 宏 的 作用 感到 迷惑 。 也 就 是 说 ， 宏 提供 了 一 种 对 组 成 C 程序 的 字 
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符 进行 变换 的 方式 ， 而 并 不 作用 于 程序 中 的 对 象 。 因 而 ， 宏 既 可 以 使 一 段 看 上 去 
完全 不 合 语法 的 代码 成 为 一 个 有 效 的 C 程序 ， 也 能 使 一 段 看 上 去 无 害 的 代码 成 为 
一 个 可 怕 的 怪物 。 


6.1 不 能 忽视 宏 定义 中 的 空格 


一 个 函数 如 果 不 带 参 数 ， 在 调用 时 只 需 在 函数 名 后 加 上 一 对 括号 即 可 加 以 调 
用 了 。 而 一 个 宏 如 果 不 带 参数 ， 则 只 需要 使 用 宏 名 即 可 ， 括 号 无 关 紧 要 。 只 要 宏 
已 经 定义 过 了 ， 就 不 会 带 来 什么 问题 ， 预 处 理 器 从 宏 定义 中 就 可 以 知道 宏 调 用 时 
是 否 需 要 参数 。 

与 宏 调 用 相 比 ， 宏 定义 显得 有 些 “暗藏 机 关 ”。 例如， 下 面 的 宏 定义 中 f 是 否 
带 了 一 个 参数 呢 ? 

#define f£ (x) {(x)-1) 
答案 只 可 能 有 两 种 :f(x) 或 者 代表 

( (x) -1) 
或 者 代表 

(x) ({x) -1) 

在 上 述 宏 定义 中 ,第 二 个 答案 是 正确 的 ， 因 为 在 f 和 后面 的 (x) 之 间 多 了 一 
个 空格 ! 所 以 ， 如 果 希 望 定义 f(x) 为 ((x)-1)， 必 须 像 下 面 这 样 写 : 

#define f(x} ((x)-1) 

这 一 规则 不 适用 于 宏 调 用 , 而 只 对 宏 定义 适用 。 因 此 ,在 上 面 完 成 宏 定 义 后 ， 
f(3) 与 f (3) 求 值 后 都 等 于 2。 


6.2 宏 并 不 是 为数 


因为 宏 从 表面 上 看 其 行为 与 函数 非常 相似 ， 程 序 员 有 时 会 禁不住 把 两 者 视 为 
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完全 等 同 。 因 此 ， 我 们 常常 可 以 看 到 类 似 下 面 的 写法 : 


#define abs(x) (((x)>=0)? (x):- (x)) 
或 者 ， 
#define max(a,b) ((a)>(b})?(a):(b}) 


请 注意 宏 定义 中 出 现 的 所 有 这 些 括号 ， 它 们 的 作用 是 预防 引起 与 优先 级 有 关 
的 问题 。 例 如 ， 假 设 宏 abs 被 定义 成 了 这 个 样子 : 

#define abs{x) x>0?x:-x 
让 我 们 来 看 abs(a-b) 求 值 后 会 得 到 怎样 的 结果 。 表 达 式 

abs (a-b) 
会 被 展开 为 

a-b>0?a-b:-a-b 

这 里 的 子 表达 式 -a-b 相当 于 (Ca)-b， 而 不 是 我 们 期 望 的 -(a-b)， 因 此 上 式 无 疑 会 
得 到 一 个 错误 的 结果 。 因 此 ， 我 们 最 好 在 宏 定义 中 把 每 个 参数 都 用 括号 括 起 来 。 
同样 ， 整 个 结果 表达 式 也 应 该 用 括号 括 起 来 ， 以 防止 当 宏 用 于 一 个 更 大 一 些 的 表 
达 式 中 可 能 出 现 的 问题 。 如 果 不 这 样 ， 

abs {a}+1 
展开 后 的 结果 为 : 

a>0?a:-a+l 
这 个 表达 式 很 显然 是 错误 的 ， 我 们 期 望 得 到 的 是 -a， 而 不 是 -a+1! abs 的 正确 定义 
应 该 是 这 样 的 : 

#define abs(x) (({x)>=0)? (x):- {x)) 

这 时 ， 

abs (a-b) 
才 会 被 正确 地 展开 为 : 

( (a-b) >02 (a-b) :- (a-b)) 
而 

abs (a}+1 
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也 会 被 正确 地 展开 为 : 

{{a})>0?(a):- (a}})+l 

即使 宏 定 义 中 的 各 个 参数 与 整个 结果 表达 式 都 被 括号 括 起 来 ， 也 仍然 还 可 能 
有 其 他 问题 存在 ， 比 如 说 ， 一 个 操作 数 如 果 在 两 处 被 用 到 ， 就 会 被 求 值 两 次 。 例 
如 ， 在 表达 式 max(a,b) 中 ， 如 果 a 大 于 b， 那 么 a 将 被 求 值 两 次 : 第 一 次 是 在 a 
与 b 比较 期 间 ， 第 二 次 是 在 计算 max 应 该 得 到 的 结果 值 时 。 


这 种 做 法 不 但 效率 低下 ， 而 且 可 能 是 错误 的 ; 


biggest = x[0]; 
i = 13 
while (i < n) 
biggest = max (biggest, x[i++]); 


如 果 max 是 一 个 真正 的 函数 ， 上 面 的 代码 可 以 正常 工作 ; 而 如 果 max 是 一 个 


宏 ， 那 么 就 不 能 正常 工作 。 要 看 清楚 这 一 点 ， 我 们 首先 初始 化 数组 x 中 的 一 些 元 
素 : 

x[0] = 2; 

x[1] = 3; 

[2] 二 过 


然后 考察 在 循环 的 第 一 次 迭代 时 会 发 生 什 么 。 上 面 代码 中 的 赋值 语句 将 被 扩 
展 为 : 

biggest = ((biggest)>(x[i++])?(biggest}: (x{[i++])})}); 

首先 ， 变 量 biggest 将 与 x[it+] 比 较 。 因 为 i 此 时 的 值 是 1，x[1] 的 值 是 3， 而 
变量 biggest 此 时 的 值 是 x[0] 即 2， 所 以 关系 运算 的 结果 为 false〈 假 )。 这 里 ， 因 
为 it+ 的 副作用 ， 在 比较 后 i 递增 为 2。 

因为 关系 运算 的 结果 为 false〔 假 )， 所 以 xfit+] 的 值 将 被 赋 给 变量 biggest。 
然而 ， 经 过 i++ 的 递增 运算 后 ，i 此 时 的 值 是 2。 所 以 ， 实 际 上 赋 给 变量 biggest 
的 值 是 x[2]， 即 1。 这 时 ， 又 因为 i++ 的 副作用 ，i 的 值 成 为 3。 

解决 这 类 问题 的 一 个 办 法 是 ， 确 保 宏 max 中 的 参数 没有 副作用 : 

biggest = x[0]; 

for {i = 1; i< n; I++) 


biggest = max {biggest, x[1]); 
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另 一 个 办 法 是 让 max 作为 函数 而 不 是 宏 , 或 者 直接 编写 比较 两 数 取 较 大 者 的 
运算 的 代码 : 
biggest = x[0]; 
for (i = 1; i< n; i++) 
if (x[i] > biggest) 
biggest = x{il; 


下 面 是 另外 一 个 例子 ， 其 中 因为 混合 了 宏和 递增 运算 的 副作用 ， 使 代码 显得 
发 发 可 危 。 这 个 例子 是 宏 putc 的 一 个 典型 定义 ; 
#define putc(x,p) \\ 
(--{p) ->_cnt>=0?3(*(p)->_ptr++= (Xx)):_flsbuf (x,p)} 


宏 putc 的 第 一 个 参数 是 将 要 写 入 文件 的 字符 ， 第 二 个 参数 是 一 个 指针 ， 指 向 
一 个 用 于 描述 文件 的 内 部 数据 结构 。 请 注意 这 里 的 第 一 个 参数 x， 它 极 有 可 能 是 
类 似 于 *z++ 这 样 的 表达 式 。 尽 管 x 在 宏 putc 的 定义 中 两 个 不 同 的 地 方 出 现 了 两 次 ， 
但 是 因为 这 两 次 出 现 的 地 方 是 在 运算 符 :的 两 侧 ， 所 以 x 只 会 被 求 值 一 次 。 


第 二 个 参数 p 则 恰恰 相反 , 它 代表 将 要 写 入 字符 的 文件 , 总 是 会 被 求 值 两 次 。 
内 为 文件 参数 p 一 般 不 需要 作 递 增 递 减 之 类 有 副作用 的 操作 ， 所 以 这 很 少 引 起 麻 
烦 。 不过, ANSIC 标准 中 还 是 提出 了 警告 ; putc 的 第 二 个 参数 可 能 会 被 求 值 两 次 。 
某 些 C 语言 实现 对 宏 putc 的 定义 也 许 不 会 像 上 面 的 定义 那样 小 心机 必 , putc 的 第 
一 个 参数 很 可 能 被 不 止 一 次 求 值 ， 这 样 实现 是 可 能 的 。 编 程 者 在 给 pute 一 个 可 能 
有 副作用 的 参数 时 ， 应 该 考虑 一 下 正在 使 用 的 C 语言 实现 是 否 足够 周密 。 


再 举 一 个 例子 ， 考 虑 许多 C 库 文件 中 都 有 的 toupper 函数 ， 该 函数 的 作用 是 
将 所 有 的 小 写字 母 转换 为 相应 的 大 写字 母 ， 而 其 他 的 字符 则 保持 原状 。 如 果 我 们 
假定 所 有 的 小 写字 母 和 所 有 的 大 写字 母 在 机 器 字符 集中 都 是 连续 排列 的 《在 大 小 
写字 母 之 间 可 能 有 一 个 固定 的 间隔 )， 那 么 我 们 可 以 这 样 实现 toupper 函数 

toupper (int c) 

{ 

主 0 we TA kk CC < rz") 
c += 'A' ?'a'; 


return cs 
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} 


在 大 多 数 C 语言 实现 中 ,toupper 函数 在 调用 时 造成 的 系统 开销 要 大 大 多 于 函 
数 体内 的 实际 计算 操作 。 因 此 ， 实 现 者 很 可 能 禁不住 要 把 toupper 实现 为 宏 : 

#define toupper (c)\ 

({(c})>='a' && (c})<='2'? (cc)+{'A'?a'): (Cc)) 

在 许多 情况 下 ， 这 样 做 确实 比 把 toupper 实现 为 函数 要 快 得 多 。 然 而 ， 如 果 
编程 者 试图 这 样 使 用 

toupper (*p++) 
则 最 后 的 结果 会 让 所 有 人 都 大 吃 一 惊 ! 

使 用 宏 的 另 一 个 危险 是 ， 宏 展开 可 能 产生 非常 庞大 的 表达 式 ， 占 用 的 空间 远 
远 超过 了 编程 者 所 期 望 的 空间 。 例 如 ， 让 我 们 再 看 宏 max 的 定义 : 

#define maxt(arb) ((a)>(pb)?(a)j:(b)) 

假定 我 们 需要 使 用 上 面 定义 的 宏 max， 来 找到 a、b、c、d 四 个 数 的 最 大 者 ， 
最 显而易见 的 写法 是 : 


max(la,max{b,max{c,d))) 


上 面 的 式 子 展开 后 就 是 : 
((a}>(((b)>(((c)>(a)?(c): (0)}?(b}: (((c)>(d)?(c): (a)))))? 
(a}:(((b)>(((c)>(d)?(c):(d}))?(b):(((c)>(a)? (0c): (09)))))) 


确实 ， 这 个 式 子 太 长 了 ! 如 果 我 们 调整 一 下 ， 使 上 式 中 操作 数 左右 平衡 : 


max (max (a,b) ,max(c,d)) 


现在 这 个 式 子 展开 后 还 是 较 长 : 
((((a)>(Pp)?(a):(b)))>((c)>(Q)?(c): (Gd)))3? 
(((a)>(b)?(a):tb))):((c)>(Qa)?(c):(Q)))) 


其 实 ， 写 成 以 下 代码 似乎 更 容易 一 些 ; 
biggest = a; 

if (biggest < b) biggest = b; 

if {biggest < C) biggest = Ci 

if (biggest < d) biggest = d; 
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6.3 ” 宏 并 不 是 语句 


编程 者 有 时 会 试图 定义 宏 的 行为 与 语句 类 似 ， 但 这 样 做 的 实际 困难 往往 令 人 
吃惊 ! 举例 来 说 ， 考 虑 一 下 assert 宏 ， 它 的 参数 是 一 个 表达 式 ， 如 果 该 表达 式 为 
0， 就 使 程序 终止 执行 ， 并 给 出 一 条 适当 的 出 错 消息 。 把 assert 作为 宏 来 处 理 ， 这 
样 就 使 得 我 们 可 以 在 出 错 信息 中 包括 有 文件 名 和 断言 失败 处 的 行 号 。 也 就 是 说 ， 


assert (x>y);，; 
在 x 大 于 y 时 什么 也 不 做 ， 其 他 情况 下 则 会 终止 程序 。 

下 面 是 我 们 定义 assert 宏 的 第 一 次 尝试 : 

#define assert(e) if {!e) assert_error{__FILE ,__LINE_  ) 

因为 考虑 到 宏 assert 的 使 用 者 会 加 上 一 个 分 号 ， 所 以 在 宏 定义 中 并 没有 包括 
分 号 。_FILE_ 和 __LINE_ 是 内 建 于 C 语言 预 处 理 器 中 的 宏 ， 它 们 会 被 扩展 为 
所 在 文件 的 文件 名 和 所 处 代码 行 的 行 号 。 

宏 assert 的 这 个 定义 ， 即 使 用 在 一 个 再 明白 直接 不 过 的 情形 中 ， 也 会 有 一 些 
难于 察觉 的 错误 ， 

if {x >0 &&y > 0) 

assert (x > y); 


else 


assert(ly > x);} 


上 面 的 写法 似乎 很 合理 ， 但 是 它 展 开 之 后 就 是 这 个 样子 ; 


if (x >0 &&Yy > 0) 
if(!{x > Y)) assert_error("foo.c", 37); 
else | 


ifl(!(y > X)) assert_error("foo.c", 39),， 


把 上 面 的 代码 作 适 当 的 缩 排 处 理 ， 我 们 就 能 够 看 清 它 实际 的 流程 结构 与 我 们 
期 望 的 结构 有 怎样 的 区 别 |: 


if (x > 0 && yy > 0) 
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if(!(x > Y)) 

assert_error ("foo.c", 37); 
else 

if(!(ly > X)) 


assert_error{"foo.c", 39}); 


读者 也 许 会 想到 ， 在 宏 assert 的 定义 中 用 大 括号 把 宏 体 整个 给 “ 括 ” 起 来 ， 
就 能 避免 这 样 的 问题 产生 : 
#define assert (e}\ 


{ if {le) assert_error{__FILE .,__LINE_  }); } 


然而 ， 这 样 做 又 带 来 了 一 个 新 的 问题 。 我 们 上 面 提 到 的 例子 展开 后 就 成 了 : 
if (x >0 &&y > 0) 

{ if(!(x > y)) assert_error("foo.c", 37);); 
else 


{ if(l!(ly > x)) assert_error("foo.c", 39);}, 


在 else 之 前 的 分 号 是 一 个 语法 错误 。 要 解决 这 个 问题 ， 一 个 办 法 是 对 assert 的 调 
用 后 面 都 不 再 跟 一 个 分 号 ， 但 这 样 的 用 法 显得 有 些 “ 怪 异 ”; 

Y = distance(p, dq); 

assert (ly > 0) 


x = sqrtl(y); 


宏 assert 的 正确 定义 很 不 直观 ， 编 程 者 很 难 想 到 这 个 定义 不 是 类 似 于 一 个 语 
而 是 类 似 一 个 表达 式 


#define assert(e) \ 


可 


{({void) ((e})||_assert_error(._FILFE ,__LINE .))) 


这 个 定义 实际 上 利用 了 4 运算 符 对 两 侧 的 操作 数 依次 顺序 求 值 的 性 质 。 如 果 e 
为 tue《〈 真 )， 表 达 式 : 


(void) ((e)11_assert_error (FILE_ ， LINE__) ) 
的 值 在 没有 求 出 其 右 侧 表达 式 
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_assert_error(_FILE_， LINE__ ) ) 
的 值 的 情况 下 就 可 以 确定 最 终 的 结果 为 真 。 如 果 e 为 false ( 假 )， 右 侧 表达 式 
_assert_error(_ FILE ， LINE_ )) 
的 值 必须 求 出 ， 此 时 _assert_error 将 被 调用 ， 并 打印 出 一 条 恰当 的 “断言 失败 ”的 
出 错 消息 。 


6.4” 宏 并 不 是 类 型 定义 


宏 的 一 个 常见 用 途 是 ， 使 多 个 不 同 变 量 的 类 型 可 在 一 个 地 方 说 明 : 

#define FOOTYPE struct foo 

FOOTYPE a; 

FOOTYPE b,c; 

这 样 ， 编 程 者 只 需 在 程序 中 改动 一 行 代 码 ， 即 可 改变 a、b、c 的 类 型 ， 而 与 
a、b、c 在 程序 中 的 什么 地 方 声明 无 关 。 

宏 定 义 的 这 种 用 法 有 一 个 优点 
但 是 ， 我 们 最 好 还 是 使 用 类 型 定义 ; 

typedef struct foo FOOTYPE; 
这 个 语句 定义 了 FOOTYPE 为 一 个 新 的 类 型 ， 与 struct foo 完全 等 效 。 

这 两 种 命名 类 型 的 方式 似乎 都 差不多 ,但 是 使 用 typedef 的 方式 要 更 加 通用 一 
些 。 例 如 ， 考 虑 下 面 的 代码 : 


#define Ti struct foo * 


可 移植 性 ， 得 到 了 所 有 C 编译 器 的 支持 。 





typedef Struct foo *T2; 

从 上 面 两 个 定义 来 看 ，T1 和 T2 从 概念 上 完全 符 同 ， 都 是 指向 结构 foo 的 指 
针 。 但 是 ， 当 我 们 试图 用 它们 来 声明 多 个 变量 时 ， 问 题 就 来 了 ; 

Tl a, b; 

T2 a Ds 


第 一 个 声明 被 扩展 为 


struct foo * a, b; 
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这 个 语句 中 a 被 定义 为 一 个 指向 结构 的 指针 ， 而 b 却 被 定义 为 一 个 结构 “而 
不 是 指针 )。 第 二 个 声明 则 不 同 ， 它 定义 了 a 和 都 是 指 疝 结 构 的 指针 ， 因 为 这 里 
T2 的 行为 完全 与 一 个 真实 的 类 型 相同 。 

练习 6-1。 请 使 用 宏 来 实现 max 的 一 个 版 本 ， 其 中 max 的 参数 都 是 整数 ， 要 
求 在 宏 max 的 定义 中 这 些 整 型 参数 只 被 求 值 一 次 。 

练习 6-2。 本 章 第 1 节 中 提 到 的 “表达 式 ” 

(x) ((x) -1) 

能 和 否 成 为 一 个 合法 的 C 表达 式 ? 
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C 语言 在 许多 不 同 的 系统 平台 上 都 有 实现 。 的 确 ， 使 用 C 语言 编写 程序 的 一 
个 首要 原因 就 是 ，C 程序 能 够 方便 地 在 不 同 的 编程 环境 中 移植 。 


然而 , 由 于 C 语言 实现 是 如 此 之 多 , 各 个 实现 之 间 有 着 或 多 或 少 的 细微 差别 ， 
以 至 于 没有 两 个 实现 是 完全 相同 的 。 即 使 是 写 得 最 早 的 两 个 C 语言 编译 器 ， 它 们 
之 间 也 有 着 很 大 区 别 。 此 外 ,不同 的 系统 有 不 同 的 需求 ,因此 我 们 应 该 能 够 料 到 ， 
机 器 不 同 则 其 上 的 C 语言 实现 也 有 细微 差别 。ANSI C 标准 的 发 布 能 够 在 一 定 程 
度 上 解决 问题 ， 但 并 不 是 万 验 灵 药 。 

早期 的 C 语言 实现 都 是 由 一 个 共同 的 “祖先 ”发 展 而 来 ， 因 此 在 这 些 实现 中 
许多 C 库 函 数 是 由 这 个 共同 “祖先 ”形成 的 。 此 后 人 们 开始 在 不 同 的 操作 系统 上 
实现 C， 他 们 仍然 试图 使 C 库 函 数 的 行为 方式 与 早期 程序 中 所 使 用 的 库 函 数 保持 
一 致 。 

这 种 尝试 并 不 总 是 成 功 的 。 而 且 ， 随 着 世界 各 地 越 来 越 多 的 人 们 开始 在 不 同 
的 C 语言 实现 上 工作 ， 某 些 库 函 数 的 性 质 几 乎 是 注定 要 发 生 分 化 。 今 天 ， 一 个 C 
程序 员 如 果 希 望 自己 写 的 程序 在 另 一 个 编程 环境 也 能 够 工作 ， 他 就 必须 掌握 许多 
这 类 细小 的 差别 。 

因而 ， 可 移植 性 是 一 个 涵盖 范围 非常 宽泛 的 主题 。 从 这 个 主题 通常 的 形式 来 
看 , 它 大 大 超出 了 本 书 论述 的 范围 .Mark Horton 在 他 的 著作 How to Write Portable 
Sofware in  C (Prentice-Hall) 中 详 拖 弗 辣 论 昨 站 个 主题 。 本 章 要 讨论 的 只 是 少数 





103 


C 陷阱 与 缺陷 


几 个 最 常见 的 错误 来 源 ， 重 点 放 在 语言 的 属性 上 ， 而 不 是 在 函数 库 的 属性 上 。 


7.1 应 对 C 语言 标准 变更 


笔者 在 写作 这 本 书 的 时 候 ，ANSI 委员 会 关于 最 新 的 C 语言 标准 的 工作 也 接 
近 尾 声 了 。 这 个 标准 包括 了 许多 新 的 语言 概念 ， 这 些 概念 在 目前 的 C 编译 器 中 并 
不 是 普遍 地 得 到 了 支持 。 而 且 ， 即 使 我 们 可 以 合理 地 假设 C 编译 器 销售 商会 逐渐 
向 ANSI C 标准 靠拢 ， 很 显然 所 有 的 C 语言 用 户 并 不 会 马上 升级 他 们 的 编译 器 。 
新 的 编译 器 所 费 不 菲 ， 而 且 安 装 也 费时 费力 。 只 要 编译 器 还 能 工作 ， 为 什么 要 替 
换 它 呢 ? 

这 种 语言 标准 的 变更 使 得 C 程序 的 编写 者 面临 一 个 两 难 境地 : 程序 中 是 否 应 
该 用 到 新 的 特性 呢 ? 如 果 使 用 它们 , 程序 无 疑 更 加 容易 编写 ,而 且 不 大 容易 出 错 ， 
但 是 那样 做 也 有 代价 ， 那 就 是 这 些 程序 在 较 早 的 编译 器 上 将 无 法 工作 。 


本 书 的 4.4 节 讨 论 了 一 个 这 类 例子 : 函数 原型 的 概念 。 让 我 们 回想 一 下 4.4 
节 中 提 到 的 square 函数 ， 
double 
square (double x) 
{ 
return x*x; 


} 


如 果 这 样 写 ， 这 个 函数 在 很 多 编译 器 上 都 不 能 通过 编译 。 如 果 我 们 按照 旧 风 
格 来 重 写 这 个 函数 , 因为 ANSI 标准 为 了 保持 和 以 前 的 用 法 兼容 也 允许 这 种 形式 ， 
这 就 增强 了 它 的 可 移植 性 : 

double 


square (x) 


double x; 


return x*x; 


第 7 章 可 移植 性 缺陷 


这 种 可 移植 性 的 获得 当然 也 付出 了 代价 。 为 了 与 旧 用 法 保持 一 致 ， 我 们 必须 
在 调用 了 square 函数 的 程序 中 作 如 下 声明 ， 

double square{); 

函数 声明 中 略 去 参数 类 型 的 说 明 ， 这 在 ANSI C 标准 中 也 是 合法 的 。 因 为 这 
样 的 声明 并 没有 对 参数 类 型 做 出 任何 说 明 ， 就 意味 着 如 果 在 尔 数 调用 时 传 入 了 错 
误 类 型 的 参数 ， 函 数 调用 就 会 不 声 不 响 地 失败 : 


double square(),; 


maint{)} 
{ 
printf("%g\n", square(3)); 


函数 square 的 声明 中 并 没有 对 参数 类 型 做 出 说 明 ， 因 此 在 编译 main 函数 时 ， 
编译 器 无 法 得 知 函数 square 的 参数 类 型 应 该 是 double， 而 不 是 int。 这 样 ， 程 序 打 
印 出 的 将 是 一 堆 “ 垃 圾 信息 ”。 要 检测 这 类 问题 ， 有 一 个 办 法 就 是 使 用 本 书 4.0 节 
中 提 到 的 lint 程序 ， 前 提 是 编程 者 的 C 语言 实现 提供 了 这 一 工具 。 

如 果 上 面 的 程序 被 写成 了 这 样 : 


double square (double) :; 


maint{) 
{ 
printf("%g\n", square(3)); 


这 里 ，3 会 被 自动 转换 为 double 类 型 。 另 一 种 改写 的 方式 是 ， 在 这 个 程序 中 显 式 
地 给 函数 square 传 入 一 个 double 类 型 的 参数 : 


double square() :; 


maint() 


{ 
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printf("%g\n", square(3.0)); 
} 


这 样 做 程序 就 能 得 到 正确 的 结果 。 即 使 是 对 于 那些 不 允许 在 函数 声明 中 包括 参数 
类 型 的 旧 编 译 器 ， 第 二 种 写法 也 仍然 能 够 使 程序 照常 工作 。 

许多 有 关 可 移植 性 的 决策 都 有 类 似 的 特点 。 一 个 程序 员 是 否 应 该 使 用 某 个 新 
的 或 特定 的 特性 ? 使 用 该 特性 也 许 能 给 编程 带 来 巨大 的 方便 ， 但 代价 却 是 使 程序 
失去 了 一 部 分 潜在 用 户 。 

这 个 问题 确实 难于 回答 。 程 序 的 生命 期 往往 超过 了 编程 者 最 初 的 预料 ， 即 使 
这 个 程序 只 是 编程 者 出 于 自用 的 目的 而 编写 的 。 因 此 ， 我 们 不 能 只 看 到 当前 的 需 
要 ， 而 忽视 未 来 可 能 的 需要 。 然 而 ， 我 们 从 上 面 的 例子 中 已 经 看 到 了 : 为 了 尽量 
增加 程序 的 可 移植 性 ， 让 过 去 的 工具 能 够 继续 工作 ， 而 放弃 现在 可 能 的 收益 ， 这 
种 代价 又 未 免 过 于 昂贵 。 要 解决 这 类 有 关 决 定 的 问题 ， 最 好 的 做 法 也 许 就 是 承认 
我 们 需要 下 定 决 心 才能 做 出 选择 ， 因 此 必须 慎重 对 待 ， 不 能 等 闲 视 之 。 


7.2 标识 符 名 称 的 限制 


某 些 C 语 言 实现 把 一 个 标识 符 中 出 现 的 所 有 字符 都 作为 有 效 字符 处 理 ， 而 男 
一 些 C 实现 却 会 自动 地 截断 一 个 长 标识 符 名 称 的 尾部 。 连 接 器 也 会 对 它们 能 够 处 
理 的 名 称 强加 限制 ， 例 如 外 部 名 称 中 只 允许 使 用 大 写字 母 。C 实现 者 在 面 对 这 样 
的 限制 时 ， 一 个 合理 的 选择 就 是 强制 所 有 的 外 部 名 称 必须 是 大 写 。 事 实 上 ，ANSI 
C 标准 所 能 保证 的 只 是 ， C 实现 必须 能 够 区 别 出 前 6 个 字符 不 同 的 外 部 名 称 。 而 
且 ， 这 个 定义 中 并 没有 区 分 大 写字 母 与 其 对 应 的 小 写字 母 。 

因为 这 个 原因 ， 为 了 保证 程序 的 可 移植 性 ， 谨 慎 地 选择 外 部 标识 符 的 名 称 是 
重要 的 。 比 方 说 ， 两 个 函数 的 名 称 分 别 为 print_fields 与 print_float， 这 样 的 命名 
方式 就 不 恰当 ; 同 理 ， 使 用 State 与 STATE 这 样 的 命名 方式 也 不 明智 。 


下 面 这 个 例子 多 少 有 些 让 人 吃惊 ， 考 虑 以 下 函数 ; 


Char * 


Malloc (unsigneqd n) 
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char *p, *malloc {unsigned),，; 
p = malloct{n),; 
if (p == NULL) 
panic("out of memory") ; 
return p; 


. 


上 面 的 例子 程序 演示 了 一 个 确保 检测 到 内 存 耗 尽 的 异常 情况 的 简单 办 法 。 编 
程 者 的 想法 是 ， 在 程序 中 应 该 调用 malloc 函数 分 配 内 存 的 地 方 ， 改 为 调用 Malloc 
函数 。 如 果 malloc 函数 调用 失败 ， 则 panic 函数 将 被 调用 ，panil 函数 终止 程序 ， 
并 打印 出 一 条 恰当 的 出 错 消息 。 这 样 ， 客 户 程 序 就 不 必 在 每 次 调用 malloc 函数 时 
都 要 进行 检查 。 

然而 ,考虑 一 下 如 果 这 个 函数 的 编译 环境 是 不 区 分 外 部 名 称 大 小 写 的 C 语言 
实现 ， 将 会 发 生 怎样 的 情况 呢 ? 此 时 ， 函 数 malloc 与 Malloc 实际 上 是 等 同 的 。 
也 就 是 说 ， 库 函数 malloc 将 被 上 面 的 Malloc 函数 等 效 奉 换 。 当 在 Malloc 函数 中 
调用 库 函 数 malloc 时 , 实际 上 调用 的 却 是 Malloc 函数 自身 ! 当 然 , 尽 管 函数 Malloc 
在 那些 区 分 大 小 写 的 C 语 言 实现 上 仍然 能 够 正常 工作 , 但 在 这 种 情况 下 结果 却 是 : 
程序 在 第 一 次 试图 分 配 内 存 时 对 Malloc 函数 的 调用 将 引起 一 系列 的 递归 调用 , 而 
这 些 递归 调用 又 不 存在 一 个 返回 点 ， 最 后 引发 灾难 性 的 后 果 ! 


7.3 ”整数 的 大 小 


C 语言 中 为 编程 者 提供 了 3 种 不 同 长 度 的 整数 : short 型 、int 型 和 long 型 ，C 
语言 中 的 字符 行为 方式 与 小 整数 相似 。C 语言 的 定义 中 对 各 种 不 同类 型 整数 的 相 
对 长 度 作 了 一 些 规定 : 

1. 3 种 类 型 的 整数 其 长 度 是 非 递 减 的 。 也 就 是 说 ，short 型 整数 容纳 的 值 肯 定 
能 够 被 int 型 整数 容纳 ，int 型 整数 容纳 的 值 也 肯定 能 够 被 long 型 整数 容纳 。 对 于 
一 个 特定 的 C 语言 实现 来 说 ， 并 不 需要 实际 支持 3 种 不 同 长 度 的 整数 ,但 可 能 不 
会 让 short 型 整数 大 于 int 型 整数 ， 而 int 型 整数 大 于 long 型 整数 。 
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2. 一 个 普通 (int 类 型 ) 整数 足够 大 以 容纳 任何 数组 下 标 。 

3, 字符 长 度 由 硬件 特性 决定 。 

现代 大 多 数 机 器 的 字符 长 度 是 8 位 , 也 有 一 些 机 器 的 字符 长 度 是 9 位 。 然 而， 
现在 越 来 越 多 的 C 语言 实现 中 的 字符 长 度 都 是 16 位 ， 以 能 够 处 理 诸如 日 语 之 类 
的 语言 的 大 字符 集 。 

ANSI 标准 要 求 long 型 整数 的 长 度 至 少 应 该 是 32 位 , 而 short 型 和 int 型 整数 
的 长 度 至 少 应 该 是 16 位 。 因为 大 多 数 机 器 中 字符 长 度 是 8 位, 对 这 些 机 器 而 言 最 
方便 的 整数 长 度 是 16 位 和 32 位 ， 因 此 所 有 早期 的 C 编译 器 也 都 能 够 满足 这 些 限 
制 条 件 。 

这 些 对 编程 实践 有 什么 意义 呢 ? 最 重要 的 一 点 ， 就 是 在 这 方面 我 们 不 能 指名 
拥有 任何 可 用 的 精度 。 在 非 正 式 的 情况 下 ， 我 们 可 以 说 short 型 和 int 型 整数 〈 普 
通 整数 ) 是 16 位 ，long 型 整数 是 32 位 ， 但 即使 是 这 些 长 度 也 是 不 能 保证 的 。 程 
序 员 当然 可 以 用 一 个 int 型 整数 来 表示 一 个 数据 表格 的 大 小 或 者 数组 的 下 标 。 但 
如 果 一 个 变量 需要 存放 可 能 是 千 万 数量 级 的 数值 ， 又 该 如 何 呢 ? 

要 定义 这 样 一 个 变量 ， 可 移植 性 最 好 的 办 法 就 是 声明 该 变量 为 long 型 ， 但 在 
这 种 情况 下 我 们 定义 一 个 “新 的 ”类 型 无 疑 更 为 清晰 : 

typedef long tenmil; 

而 且 ， 程 序 员 可 以 用 这 个 新 类 型 来 声明 所 有 此 类 变量 ， 最 坏 的 情形 也 不 过 是 
我 们 只 需要 改动 类 型 定义 ， 所 有 这 些 变量 的 类 型 就 自动 变 为 正确 的 了 。 


7.4 字符 是 有 符号 整数 还 是 无 符号 整数 


现代 大 多 数 计算 机 都 支持 8 位 字符 ， 因 此 大 多 数 现代 C 编译 器 都 把 字符 实现 
为 8 位 整数 。 然 页， 并非 所 有 的 编译 器 都 按照 同样 的 方式 来 解释 这 些 8 位 数值 。 
只 有 在 我 们 需要 把 一 个 字符 值 转换 为 一 个 较 大 的 整数 时 ， 这 个 问题 才 变 得 重 
要 起 来 。 而 在 其 他 情况 下 ， 结 果 都 是 已 定义 的 : 多 余 的 位 将 被 简单 地 “丢弃 ” 编 
译 器 在 转换 char 类 型 到 int 类 型 时 ， 需 要 做 出 选择 : 应 该 将 字符 作为 有 符号 数 还 


第 7 章 可 移植 性 缺陷 


是 应 该 无 符号 数 处 理 ? 如 果 是 前 一 种 情况 ， 编 译 器 在 将 char 类 型 的 数 扩 展 到 int 
类 型 时 ， 应 该 同时 复制 符号 位 ;而 如 果 是 后 一 种 情况 ， 编 译 器 只 需 在 多 余 的 位 上 
直接 填充 0 即 可 。 

如 果 一 个 字符 的 最 高 位 是 1， 编 译 器 是 将 该 字符 当 作 有 符号 数 ， 还 是 无 符号 
数 呢 ? 对 于 任何 一 个 需要 处 理 该 字符 的 程序 员 来 说 ， 上 述 选择 的 结果 非常 重要 。 
它 决定 着 一 个 8 位 字符 的 取 值 范围 是 从 -128 到 127， 还 是 从 0 到 255。 而 这 一 点 ， 
又 反 过 来 影响 到 程序 员 对 哈 希 表 或 转换 表 等 的 设计 方式 。 

如 果 编 程 者 关注 -- 个 最 高 位 是 1 的 字符 其 数值 究竟 是 正 还 是 负 ， 可 以 将 这 个 
字符 声明 为 无 符号 字符 〈unsigned char)。 这 样 ， 无 论 是 什么 编译 器 ， 在 将 该 字符 
转换 为 整数 时 都 只 需 将 多 余 的 位 填充 为 0 即 可 。 而 如 果 声 明 为 一 般 的 字符 变量 ， 
那么 在 某 些 编译 器 上 可 能 会 作为 有 符号 数 处 理 ， 在 另 一 些 编译 器 上 又 会 作为 无 符 
号 数 处 理 。 

与 此 相关 的 一 个 常见 错误 认识 是 ， 如果 c 是 一 个 字符 变量 ， 使 用 (unsigned) c 
就 可 得 到 与 c 等 价 的 无 符号 整数 。 这 是 会 失败 的 ， 因 为 在 将 字符 c 转换 为 无 符 与 
整数 时 ，c 将 首先 被 转换 为 int 型 整数 ， 而 此 时 可 能 得 到 非 预期 的 结果 。 


正确 的 方式 是 使 用 语句 (unsigned char) c， 因 为 一 个 unsigned char 类 型 的 字符 
在 转换 为 无 符号 整数 时 无 需 首先 转换 为 int 型 整数 ， 而 是 直接 进行 转换 。 


7.5 移 位 运算 符 


使 用 移 位 运算 符 的 程序 员 经 常 对 这 样 两 个 问题 感到 困惑 : 

1. 在 向 右 移 位 时 ， 空 出 的 位 是 由 0 填充 ， 还 是 由 符号 位 的 副本 填充 ? 

2. 移 位 计数 〈 即 移 位 操作 的 位 数 ) 允许 的 取 值 范围 是 什么 ? 

第 一 个 问题 的 答案 很 简单 ， 但 有 时 却 是 与 具体 的 C 语言 实现 有 关 。 如 果 被 移 
位 的 对 象 是 无 符号 数 , 那么 空 出 的 位 将 被 0 填充 。 如果 被 移 位 的 对 象 是 有 符号 数 ， 
那么 C 语 言 实现 既 可 以 用 0 填充 空 出 的 位 ,也 可 以 用 符号 位 的 副本 填充 空 出 的 位 。 
编程 者 如 果 关 注 向 右 移 位 时 空 出 的 位 ,那么 可 以 将 操作 的 变量 声明 为 无 符号 类 型 ， 
那么 空 出 的 位 都 会 被 设置 为 0。 
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第 二 个 问题 的 答案 同样 也 很 简单 : 如果 被 移 位 的 对 象 长 度 是 n 位 ， 那 么 移 位 
计数 必须 大 于 或 等 于 0, 而 严格 小 于 n。 因 此 , 不 可 能 做 到 在 单 次 操作 中 将 某 个 数 
值 中 的 所 有 位 都 移出 。 为 什么 要 有 这 个 限制 呢 ? 因为 只 要 加 上 了 这 个 限制 条 件 ， 
我 们 就 能 够 在 硬件 上 高 效 地 实现 移 位 运算 。 

举例 来 说 ， 如 果 一 个 int 型 整数 是 32 位 ，n 是 一 个 int 型 整数 ， 那 么 n<<31 
和 n<<0 这 样 写 是 合法 的 ， 而 n<<32 和 n<<-1 这 样 写 是 非法 的 。 


需要 注意 的 是 ， 即 使 C 实现 将 符号 位 复制 到 空 出 的 位 中 ， 有 符号 整数 的 向 右 
移 位 运算 也 并 不 等 同 于 除 以 2 的 某 次 寡 。 要 证 明 这 一 点 ， 让 我 们 考虑 (-D)>>1， 这 
个 操作 的 结果 一 般 不 可 能 为 0， 但 是 (-1)/2 在 大 多 数 C 实现 上 求 值 结果 都 是 0。 这 
意味 着 以 除法 运算 来 代替 移 位 运算 ， 将 可 能 导致 程序 运行 速度 大 大 减 慢 。 举 例 而 
言 ， 如 果 已 知 下 面 表达 式 中 的 low+high 为 非 负 ， 那 么 

mid = (low + high) >> 1; 
与 下 式 


mid = (low + high) / 2; 


完全 等 效 ， 而 且 前 者 的 执行 速度 也 要 快 得 多 。 


7.6 内 存 位 置 0 


null 指针 并 不 指向 任何 对 象 。 因 此 ， 除 非 是 用 于 赋值 或 比较 运算 ， 出 于 其 他 
任何 目的 使 用 null 指针 都 是 非法 的 。 例 如 ， 如 果 p 或 q 是 一 个 nul 指针 ， 那 么 
strcmp(p, 9 的 值 就 是 未 定义 的 。 

在 这 种 情况 下 究竟 会 得 到 什么 结果 呢 ? 不 同 的 编译 器 有 不 同 的 结果 。 某 些 C 
语言 实现 对 内 存 位 置 0 强加 了 硬件 级 的 读 保 护 ， 在 其 上 工作 的 程序 如 果 错 误 使 用 
了 一 个 null 指针 , 将 立即 终止 执行 。 其 他 一 些 C 语言 实现 对 内 存 位 置 0 只 允许 读 ， 
不 允许 写 。 在 这 种 情况 下 ， 一 个 null 指针 似乎 指向 的 是 某 个 字符 串 ， 但 其 内 容 通 
常 不 过 是 一 堆 “ 垃 圾 信息 ”还 有 一 些 C 语言 实现 对 内 存 位 置 0 既 允 许 读 ， 也 人 允 
许 写 。 在 这 种 实现 上 面 工作 的 程序 如 果 错 误 使 用 了 一 个 null 指针 ， 则 很 可 能 覆盖 
了 操作 系统 的 部 分 内 容 ， 造 成 彻底 的 灾难 ! 
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严格 说 来 ， 这 并 非 一 个 可 移植 性 问题 ， 在 所 有 的 C 程序 中 ， 误 用 null 指针 的 
效果 都 是 未 定义 的 。 然 而 ， 这 和 样 的 程序 有 可 能 在 某 个 C 语言 实现 上 “似乎 ”能 够 
工作 ， 只 有 当 该 程序 转移 到 另 一 台 机 器 上 运行 时 才 会 暴露 出 问题 来 。 

要 检查 出 这 类 问题 的 最 简单 办 法 就 是 ， 把 程序 移 到 不 允许 读 取 内 存 位 置 0 的 
机 器 上 运行 。 下 面 的 程序 将 揭示 出 某 个 C 语言 实现 是 如 何 处 理 内 存 地 址 0 的 : 


#include <stdio.h> 


main() 
{ 
char *p; 
p = NULL; 
printf(l"Location 0 contains %d\n", *p); 


} 


在 禁止 读 取 内 存 地 址 0 的 机 器 上 ， 这 个 程序 将 会 执行 失败 。 在 其 他 机 器 上 ， 
这 个 程序 将 会 以 10 进 制 的 格式 打印 出 内 存 位 置 0 中 存储 的 字符 内 容 。 


7.7 除法 运算 时 发 生 的 截断 


假定 我 们 让 a 除 以 b， 商 为 q， 余 数 为 + : 


q=a/b; 

r=asb; 

这 里 ， 不 妨 假定 b 大 于 0。 

我 们 希望 a、b、q、r 之 间 维 持 怎样 的 关系 呢 ? 

1. 最 重要 的 一 点 ， 我 们 希望 g*b +r == a， 因 为 这 是 定义 余数 的 关系 。 

2. 如 果 我 们 改变 a 的 正 负 号 ， 我 们 希望 这 会 改变 q 的 符号 ， 但 这 不 会 改变 q 
的 绝对 值 。 

3. 当 b>0 时 , 我 们 希望 保证 r>=0 且 r<b。 例如 , 如 果 余 数 用 于 哈 希 表 的 索引 ， 
确保 它 是 一 个 有 效 的 索引 值 很 重要 。 
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这 三 条 性 质 是 我 们 认为 整数 除法 和 余数 操作 所 应 该 具备 的 。 很 不 幸 的 是 ， 它 
们 不 可 能 同时 成 立 。 

考虑 一 个 简单 的 例子 : 3/2， 商 为 1， 余 数 也 为 1。 此 时 ， 第 1 条 性 质 得 到 了 
满足 。(-3)/2 的 值 应 该 是 多 少 昵 ? 如 果 要 满足 第 2 条 性 质 ， 答 案 应 该 是 -1， 但 如 果 
是 这 样 ， 余 数 就 必定 是 -1， 这 样 第 3 条 性 质 就 无 法 满足 了 。 如 果 我 们 首先 满足 第 
3 条 性 质 ， 即 余数 是 1， 这 种 情况 下 根据 第 1 条 性 质 则 商 是 -2， 那 么 第 2 条 性 质 又 
无 法 满足 了 。 

因此 ，C 语言 或 者 其 他 语言 在 实现 整数 除法 截断 运算 时 ， 必 须 放 弃 上 述 三 条 
原则 中 的 至 少 一 条 。 大 多 数 程序 设计 语言 选择 了 放弃 第 3 条 ， 而 改 为 要 求 余数 与 
被 除数 的 正 负 号 相同 。 这 样 ， 性 质 1 和 性 质 2 就 可 以 得 到 满足 。 大 多 数 C 编译 器 
在 实践 中 也 都 是 这 样 做 的 。 


然而 , C 语言 的 定义 只 保证 了 性 质 1， 以 及 当 a>=0 且 b>0 时 ,保证 Irl<lbl 以 及 
I>=0。 后 面部 分 的 保证 与 性 质 2 或 者 性 质 3 比较 起 来 ， 限 制 性 要 弱 得 多 。 


C 语言 的 定义 虽然 有 时 候 会 带 来 不 需要 的 灵活 性 ， 但 大 多 数 时 候 ， 只 要 编程 
者 清楚 地 知道 要 做 什么 、 该 做 什么 ， 这 个 定义 对 让 整数 除法 运算 满足 其 需要 来 说 
还 是 够 用 了 的 。 例 如 ， 假 定 我 们 有 一 个 数 n， 它 代表 标识 符 中 的 字符 经 过 某 种 函 
数 运算 后 的 结果 ， 我 们 希望 通过 除法 运算 得 到 哈 希 表 的 条 目 h， 满 足 
0<=h<HASHSIZE。 又 如 果 已 知 n 恒 为 非 负 ， 那 么 我 们 只 需要 像 下 面 一 样 简单 地 
写 : 

hn = n % HASHSIZE; 


然而 ， 如 果 n 有 可 能 为 负数 ， 而 此 时 h 也 有 可 能 为 负 ， 那 么 这 样 做 就 不 一 定 
总 是 合适 的 了 。 不 过 ， 我 们 已 知 hb>-HASHSIZE， 因 此 我 们 可 以 这 样 写 ;: 


h = n % HASHSIZE; 
if (h < 0) 
h += HASHSIZE; 


更 好 的 做 法 是 ， 程 序 在 设计 时 就 应 该 避免 n 的 值 为 负 这 样 的 情形 ， 并 且 声 明 
n 为 无 符号 数 。 
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7.8 ”随机 数 的 大 小 


最 早 的 C 语 言 实现 运行 于 PDP-11 计算 机 上 , 它 提供 了 一 个 称 为 rand 的 函数 ， 
该 函数 的 作用 是 产生 一 个 ( 伪 ) 随机 非 负 整数 。PDP-11 计算 机 上 的 整数 长 度 为 
16 位 (包括 了 符号 位 )， 因 此 rand 函数 将 返回 一 个 介 于 0 到 25-1 之 间 的 整数 。 


当 在 VAX-11 计算 机 上 实现 C 语言 时 ， 因 为 该 种 机 器 上 整数 的 长 度 为 32 位 ， 
这 就 带 来 了 一 个 实现 方面 的 问题 ，VAX-11 计算 机 上 rand 函数 的 返回 值 范围 应 该 
是 多 少 呢 ? 

当时 有 两 组 人 员 同 时 分 别 在 VAX-11 计算 机 上 实现 C 语言 ， 他 们 做 出 的 选择 
互 不 相同 。 一 组 人 员 在 加 州 大 学 伯克利 分 校 ， 他 们 认为 rand 函数 的 返回 值 范围 应 
该 包括 该 机 器 上 所 有 可 能 的 非 负 整数 取 值 , 因此 他 们 设计 版 本 的 rand 函数 返回 一 
个 介 于 0 到 231-1 的 整数 。 


另 一 组 人 员 在 AT&T， 他 们 认为 如 果 VAX-11 计算 机 上 的 rand 函数 返回 值 范 
围 与 PDP-11 计算 机 上 的 一 样 ， 即 介 于 0 到 25-1 之 间 的 整数 ， 那 么 在 PDP-11 计 
算 机 .上 所 写 的 程序 就 能 够 较为 容易 移植 到 VAX-11 计算 机 上 。 

这 样 造成 的 后 果 是 ， 如 果 我 们 的 程序 中 用 到 了 rand 函数 ， 在 移植 时 就 必须 根 
据 特定 的 C 语言 实现 作出 “剪裁 > ANSIC 标准 中 定义 了 一 个 常数 RAND_MAX,， 
它 的 值 等 于 随机 数 的 最 大 取 值 ， 但 是 早期 的 C 实现 通常 都 没有 包含 这 个 常数 。 


7.9 大 小 写 转换 


库 函 数 toupper 和 tolower 也 有 与 随机 数 类 似 的 历史 。 它 们 起 初 被 实现 为 宏 : 


#define toupper{c) {(c}+'A'-'a') 

#define tolower{c) ((c}+'a'-'A')} 

当 给 定 一 个 小 写字 母 作为 输入 ，toupper 将 返回 对 应 的 大 写字 母 。 而 tolower 
的 作用 正好 相反 。 这 两 个 宏 都 依赖 于 特定 实现 中 字符 集 的 性 质 ， 即 需要 所 有 的 大 
写字 母 与 相应 的 小 写字 母 之 间 的 差 值 是 一 个 常量 。 这 个 假定 对 ASCII 字符 集 和 


113 


C 陷阱 与 缺陷 





EBCDIC 字符 集 来 说 都 是 成 立 的 。 而 且 ， 因 为 这 些 宏 定 义 不 能 移植 ， 且 这 些 宏 定 
义 都 被 封装 在 一 个 文件 中 ， 所 以 这 个 假定 也 并 不 那么 危险 。 

然而 ， 这 些 宏 确 实 有 一 个 不 足 之 处 ， 如果 输入 的 字母 大 小 写 不 对 ， 那 么 它们 
返回 的 就 都 是 无 用 的 垃圾 信息 。 考 虑 下 面 的 程序 段 ， 其 作用 是 把 一 个 文件 中 的 大 
写字 母 全 部 转换 为 小 写字 母 ， 这 个 程序 段 看 上 去 没什么 问题 ， 但 实际 上 却 无 法 工 
作 : 


int c; 

while ((c = getchar()) != EOF) 
putchar (tolower (c)); 

我 们 应 该 写成 这 样 才 对 : 

int c; 

while ((c = getchar()) != EOF) 


putchar {isupper (c}? tolower {c}: c); 


有 一 次 , AT&T 软件 开发 部 门 的 一 个 极 具 创新 精神 的 人 注意 到 , 大 多 数 toupper 
和 tolower 的 使 用 都 需要 首先 进行 检查 以 保证 参数 是 合适 的 。 慎 重 考虑 之 后 ， 他 
决定 把 这 些 宏 重 写 如 下 : 
#define toupper(c) ((c) >= 'a' && (c) <= '2'? (C) + 'A' - 'a’: (c)) 
#define tolower(c) ((c) >= 'A' && (Cc) <= '2'? (Cc) + 'a' - 'A': (¢)) 
他 又 意识 到 这 样 做 有 可 能 在 每 次 宏 调用 时 ， 致 使 c 被 求 值 1 到 3 次 。 如 果 遇 到 类 
似 toupper(*p++) 这 样 的 表达 式 ， 可 能 造成 不 良 后 果 。 因 此 ， 他 决定 重 写 toupper 
和 tolower 为 函数 ， 重 写 后 的 toupper 函数 看 上 去 大 致 像 这 样 : 
int 
toupper (int c) 
{ 
if (cc >= 'a' && CC <= '2') 
return C + 'A' -'a'; 
return c; 


} 
重 写 后 的 tolower 函数 也 与 此 类 似 。 
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这 样 改动 之 后 程序 的 健壮 性 无 疑 得 到 了 增强 ， 而 代价 是 每 次 使 用 这 些 函 数 时 
却 又 引入 了 函数 调用 的 开销 。 他 意识 到 某 些 人 也 许 不 愿意 付出 效率 方面 损失 的 代 
价 ， 因 此 他 又 重新 引入 了 这 些 宏 ， 不 过 使 用 了 新 的 宏 名 : 

#define _toupper(c) ((c)+'A'-'a') 

#define _tolower(c) ((c)+'a'-’'A’) 

这 样 ， 宏 的 使 用 者 就 可 以 在 速度 与 方便 之 间 自 由 选择 。 

这 里 还 有 一 个 问题 ， 那 就 是 加 州 大 学 伯克利 分 校 的 那 组 人 员 以 及 某 些 其 他 的 
C 语言 实现 者 ， 他 们 不 会 照 这 样 实现 大 小 写 的 转换 。 这 意味 着 ， 在 AT&T 的 系统 
上 我 们 编写 程序 使 用 toupper 和 tolower 时 ， 不 必 担 心 传 入 一 个 大 小 写 不 合适 的 字 
母 作为 参数 ， 但 在 其 他 一 些 C 语言 实现 上 ， 程 序 却 有 可 能 无 法 运行 。 如 果 编 程 者 
不 了 解 这 段 历史 ， 要 跟踪 这 类 程序 失败 就 很 困难 。 


7.10 首先 释放 ， 然 后 重新 分 配 


大 多 数 C 语言 实现 都 为 使 用 者 提供 了 3 个 内 存 分 配 函 数 ，malloc，realioc 和 
free。 调 用 malloc(n) 将 返回 一 个 指针 ， 指 向 一 块 新 分 配 的 可 以 容纳 n 个 字符 的 内 
存 , 编程 者 可 以 使 用 这 块 内 存 。 把 malloc 函数 返回 的 指针 作为 参数 传 入 给 free 函 
数 ， 就 释放 了 这 块 内 存 ， 这 样 就 可 以 重新 利用 了 。 调 用 realloc 函数 时 ， 需 要 把 指 
向 一 块 已 分 配 内 存 的 区 域 指 针 以 及 这 块 内 存 新 的 大 小 作为 参数 传 入 ， 就 可 以 调整 
(扩大 或 缩小 ) 这 块 内 存 区 域 为 新 的 大 小 ， 这 个 过 程 中 有 可 能 涉及 到 内 存 的 拷贝 。 


凡事 皆 有 例外 。UNIX 系统 参考 手册 第 7 版 中 描述 的 realloc 函数 的 行为 ， 与 
上 面 所 讲 就 略 有 不 同 : 

Realloc 函数 把 指针 ptr 所 指向 内 存 块 的 大 小 调整 为 size 字 节 ， 返 回 一 个 指向 
调整 后 内 存 块 (可 能 该 内 存 块 已 经 被 移动 过 了 ) 的 指针 。 人 假定 这 块 内 存 原来 大 小 
为 oldsize， 新 的 大 小 为 newsize， 这 两 个 数 之 间 较 小 者 为 min(oldsize, newsize)， 
那么 内 存 块 中 min(oldsize, newsize) 部 分 存储 的 内 容 将 保持 不 变 。 

如 果 ptr 指向 的 是 一 块 最 近 一 次 调用 malloc, realloc 或 calloc 分 配 的 内 存 ， 即 
使 这 块 内 存 已 被 释放 , realloc 函数 仍然 可 以 工作 。 因此 , 可 以 通过 调节 free, malloc 
和 realloc 的 调用 顺序 ， 充 分 利用 malloc 函数 的 搜索 策略 来 压缩 存储 空间 。 

也 就 是 说 ， 这 一 实现 允许 在 某 内 存 块 被 释放 之 后 重新 分 配 其 大 小 ， 前 提 是 内 
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存 重 分 配 〈reallocation) 操作 执行 得 必须 足够 早 。 因 此 ， 在 符合 第 7 版 参考 手册 
描述 的 系统 中 ， 下 面 的 代码 就 是 合法 的 ; 

free (P) : 

p = realloc (p, newsize); 

在 一 个 有 这 样 特殊 性 质 的 系统 中 ， 我 们 可 以 用 下 面 这 个 多 少 有 些 “ 怪 异 ” 的 
办 法 ， 来 释放 一 个 链表 中 的 所 有 元 素 : 

for (p = head; p != NULL; Pp = p->next) 


free ((char *) p); 
这 里 ， 我 们 不 必 担 心 调用 free 之 后 ， 会 使 p->next 安 得 无 效 。 
当然 ， 这 种 技巧 不 值得 推荐 ， 因 为 并 非 所 有 的 C 实现 在 某 块 内 存 被 释放 后 还 
能 较 长 时 间 的 保留 之 。 不 过 ， 第 7 版 参考 手册 还 有 一 点 没有 提 到 : 早期 的 realloc 
函数 的 实现 要 求 待 重新 分 配 的 内 存 区 域 必须 首先 被 释放 。 因 为 这 个 原因 ， 仍 然 还 
有 一 些 较 老 的 C 程序 是 首先 释放 某 块 内 存 ， 然 后 再 重新 分 配 这 块 内 存 。 当 我 们 移 
植 这 样 一 个 较 老 的 C 程序 到 一 个 新 的 实现 中 时 ， 必 须 注意 到 这 一 点 。 


7.11 可 移植 性 问题 的 一 个 例子 


让 我 们 来 看 这 样 一 个 问题 ， 这 个 问题 许多 人 都 遇 到 过 ， 也 被 解决 过 许多 次 ， 
因此 非常 具有 代表 性 。 下 面 的 程序 接受 两 个 参数 ， 一 个 long 型 整数 和 一 个 函数 指 
针 。 这 段 程序 的 作用 是 把 给 出 的 long 型 整数 转换 为 其 10 进 制 表 示 ， 并 且 对 10 进 
制 表示 中 的 每 个 字符 都 调用 函数 指针 所 指向 的 函数 ， 

void 

printnum (long n, void (*p}(}) 

{ 

if (n < 0) { 
(CPD) (0) 


} 
Ef (TS LO0) 


printnum (n/10, p); 
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(*p) ({int}(n % 10) + '0'); 


这 段 程 序 写 得 非常 明白 直接 。 首 先 ， 我 们 检查 n 是 否 为 负 ; 如 果 是 负数 ， 就 
打印 出 一 个 负 号 ， 然 后 让 n 反 号 ， 即 -n。 接 着 ， 我 们 检查 n 是 否 大 于 等 于 10; 如 
果 是 的 ， 那 么 n 的 10 进 制 表示 要 包含 两 个 或 两 个 以 上 数字 ， 然 后 我 们 递归 调用 
printnum 函数 打印 出 n 的 10 进 制 表示 中 除 最 后 一 位 以 外 的 所 有 数字 。 最后， 我 们 
打印 出 n 的 10 进 制 表示 中 的 来 位 数字 。 为 了 使 *p 能 够 处 理 正确 参数 类 型 ， 这 里 
把 表达 式 n%10 的 类 型 转换 为 int 类 型 。 这 一 点 在 ANSIC 标准 中 其 实 并 不 必要 ， 
之 所 以 进行 类 型 转换 主要 是 为 了 避免 某 些 人 可 能 只 是 简单 地 改写 一 下 printnum 的 
函数 头 ， 就 将 程序 移植 到 早期 的 C 实现 上 。 
本 -一 一 一 一 Foy 








这 个 程序 尽管 简单 ， 却 存在 几 个 可 移植 性 方面 的 问题 。 第 一 个 问题 出 在 该 程 
序 把 n 的 10 进 制 表示 的 末 位 数字 转换 为 字符 形式 时 所 用 的 方法 , 通过 n9%10 来 得 
到 末 位 数字 的 值 ， 这 一 点 没有 什么 问题 ; 但 是 给 它 加 上 '0 来 得 到 对 应 的 字符 表示 
却 不 一 定 合适 。 程 序 中 的 加 法 操作 实际 上 假定 了 在 机 器 的 字符 集中 数字 是 顺序 排 
列 、 没 有 间隔 的 ， 这 样 才 有 '0'+5 的 值 与 '5' 的 值 相同 ， 依 次 类 推 。 这 种 假定 ， 
对 ASCII 字符 集 和 EBCDIC 字符 集 是 正确 的 ,对 符合 ANSI 的 C 实 现 也 是 正确 的 ， 
但 对 某 些 机 器 却 有 可 能 出 错 。 要 避免 这 个 问题 ， 解 决 办 法 是 使 用 一 张 代表 数字 的 
字符 表 。 因 为 一 个 字符 串 常 量 可 以 用 来 表示 一 个 字符 数组 ， 所 以 在 数组 名 出 现 的 
地 方 都 可 以 用 字符 串 常量 来 蔡 换 。 下 面 例子 中 printnum 函数 的 这 个 表达 式 虽 然 有 
些 令 人 吃惊 ， 却 是 合法 的 : 

"0123456789"[n % 10] 
我 们 把 前 面 的 程序 进行 如 下 改写 ， 就 解决 了 第 一 个 可 移植 性 问题 


void 
printnum (long n, void {x*p)()) 
{ 
if 人 < 0) { 
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if (n >= 10) 
printnum (n/10, p); 
{*p) {"0123456789"[n % 10]); 
} 


第 二 个 问题 与 n<0 时 的 情形 有 关 。 上 面 的 程序 首先 打印 出 一 个 负 号 ， 然 后 把 
n 设置 为 -n。 这 个 赋值 操作 有 可 能 发 生 溢 出 ， 因 为 基于 2 的 补 码 的 计算 机 一 般 允 
许 表示 的 负数 取 值 范围 要 大 于 正 数 的 取 值 范围 。 具 体 来 说 ,就 是 如 果 一 个 long 型 
整数 有 k 位 以 及 一 个 符号 位 ， 该 long 型 整数 能 够 表示 -2* 却 不 能 表示 2*。 

要 解决 这 个 问题 , 有 好 几 种 办 法 。 最 明显 的 一 种 办 法 是 把 -n 赋 给 一 个 unsigned 
long 型 的 变量 ， 然 后 对 这 个 变量 进行 操作 。 但 是 ， 我 们 不 能 对 -n 求 值 ， 因 为 这 样 
做 将 引起 溢出 ! 


无 论 是 对 基于 1 的 补 码 还 是 基于 2 的 补 码 (1’s complement and 2's 
complement) 的 机 器 ， 改 变 一 个 正 整 数 的 符号 都 可 以 确保 不 会 发 生 溢 出 。 惟 一 的 
麻烦 来 自 于 当 改 变 一 个 负数 的 符号 的 时 候 。 因 此 ， 如 果 我 们 能 够 保证 不 将 n 转换 
为 对 应 的 正 数 ， 那 么 我 们 就 能 避免 这 一 问题 。 
译注 : 有 符号 整数 的 二 进 制 表示 可 以 分 为 3 个 部 分 ， 分 别 是 符号 位 (sign bit ) 、 
值 位 ( value bits ) 和 补 齐 位 (padding bits ) 。 补 齐 位 只 是 填 满 空白 位 置 ， 没 有 什么 
意义 . 当 符 号 位 是 1 时 表示 负数 ,根据 符号 位 所 代表 数值 的 不 同 ,分 为 one's comlement 
和 two's complement。 假 设 值 位 共有 NN 位 ， 则 
(1) one's complement: 二 进 制 表示 的 下 限 -(2*-1)。 

(2) two's complement: 二 进 制 表示 的 下 限 -(2™ )。 










我 们 当然 可 以 做 到 以 同样 的 方式 来 处 理 正 数 和 负数 ， 只 不 过 为 负数 时 需要 
打印 出 一 个 负 号 。 要 做 到 这 一 点 ， 程 序 在 打印 负 号 之 后 强制 n 为 负数 ， 并 且 让 所 
有 的 算术 运算 都 是 针对 负数 进行 的 。 也 就 是 说 ， 我 们 必须 保证 打印 负 号 的 操作 所 
对 应 的 程序 只 被 执行 一 次 ， 最 简单 的 办 法 就 是 把 程序 分 解 为 两 个 函数 。 现 在 ， 
printnum 函数 只 是 检查 n 是 否 为 负 ， 如 果 是 的 就 打印 一 个 负 号 。 无 论 n 为 正 为 负 ， 
printnum 函数 都 将 调用 printneg 函数 , 以 n 的 绝对 值 的 相反 数 为 参数 。 这 样 ,printneg 
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函数 就 满足 了 ja 总 为 负数 或 零 的 条 件 ， 
void 
printneg (long n, void (*p) ()) 
{ 
if (n<=-10) 
printneg {n/10, p}; 
(*p) ("0123456789"[-(n % 10)]); 


void 
printnum (long n, void {*p) ()} 


{ 


if (n < 0) { 
(*p) ('-'); 
printneg {(n, p); 
} else 
printneg (-n, p); 
} 


这 样 写 还 是 有 在 可 移植 性 方面 的 问题 。 我 们 曾经 在 程序 中 使 用 nm10 和 n%10 
来 分 别 表 示 n 的 首位 数字 与 末 位 数字 ， 当 然 还 需要 适当 改变 符号 。 回 忆 一 下 ， 本 
章 前 面 提 到 了 : 当 整 数 除 法 运算 中 的 一 个 操作 数 为 负 时 ， 它 的 行为 表现 与 具体 的 
实现 有 关 。 因 此 ， 当 n 为 负数 时 ，n%10 完全 有 可 能 是 一 个 正 数 ! 此 时 ，- % 10) 
就 是 一 个 负数 ，"0123456789"[-(n % 10)] 就 不 在 数字 数组 之 中 。 


要 解决 这 个 问题 ， 我 们 可 以 创建 两 个 临时 变量 来 分 别 保存 商 和 余数 。 在 除法 
运算 完成 之 后 , 检查 余数 是 否 在 合理 的 范围 内 如 果 不 是 ， 则 适当 调整 两 个 变量 。 
printnum 函数 不 需要 进行 修改 ， 需 要 改动 的 是 printneg 函数 ， 因 此 下 面 我 们 只 写 
出 了 printneg 函数 ; 

void 

printneg (long n, void (*p) ()) 

{ 

long q; 
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q=n/ 10; 
r=n% 10; 
if {r > 0) { 
0: 
d++7 
} 
it (n <= -10) 
printneg (q, Pp); 
{*p) ("0123456789"[-r])}); 
} 


看 到 这 里 , 读者 也 许 会 叹 一 口气 , 为 了 满足 可 移植 性 , 需要 做 的 工作 太 多 了 ! 
我 们 为 什么 要 如 此 不 辞 劳苦 地 精益 求 精 地 修改 呢 ? 因为 我 们 所 处 的 是 一 个 编程 环 
境 不 断 改变 的 世界 ， 尽 管 软件 看 上 去 不 像 便 件 那么 实在 ， 但 大 多 数 软件 的 生命 期 
却 要 长 于 它 运行 其 上 的 硬件 。 而 且 ， 我 们 很 难 预 言 未 来 硬件 的 特性 。 因 此 ， 努 力 
提高 软件 的 可 移植 性 ， 实 际 上 是 延长 了 软件 的 生命 期 。 


可 移植 性 强 的 软件 比较 不 容易 出 错 。 本 例 中 的 代码 改动 看 上 去 是 提高 软件 的 
可 移植 性 ， 实 际 上 大 多 数 工作 是 确保 边界 条 件 的 正确 ， 即 保证 当 printnum 函数 的 
参数 是 可 能 取 到 的 最 小 负数 时 ， 它 仍然 能 够 正常 工作 。 作 者 本 人 就 见 过 一 些 商 业 
软件 产品 ， 正 是 因为 对 这 种 情况 处 理 不 好 而 出 了 大 错 。 
练习 7-1， 本 章 第 3 节 中 说 ， 如 果 一 个 机 器 的 字符 长 度 为 8 位 ， 那 么 其 整数 
长 度 很 可 能 是 16 位 或 32 位。 请 问 原因 是 什么 ? 
练习 7-2。 函数 atol 的 作用 是 ， 接 受 一 个 指向 以 null 结尾 的 字符 串 的 指针 作 
为 参数 ， 返 回 一 个 对 应 的 long 型 整数 值 。 假 定 : 
， 作为 输入 参数 的 指针 ， 指 向 的 字符 串 总 是 代表 一 个 合法 的 long 型 整数 值 ， 
因此 atol 函数 无 须 检查 该 输入 是 否 越界 。 
。 惟 一 合法 的 输入 字符 是 数字 和 正 负 号 。 输入 字符 串 在 遇 到 第 一 个 非法 字符 
时 结束 。 
请 写 出 atol 函数 的 一 个 可 移植 版 本 。 
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本 书 从 第 1 章 到 第 7 章 ， 引领 着 读者 在 C 语言 中 最 为 幽 微 星 暗 的 部 分 探 奇 挠 
胜 ， 读 者 看 到 了 C 语言 是 一 个 强大 灵活 的 工具 ， 而 程序 员 一 旦 使 用 不 慎 又 是 多 么 
容易 导致 错误 。 我 们 的 探险 之 旅 已 经 结束 ， 读 者 也 许 感到 意犹未尽 ， 就 像 大 多 数 
曾经 阅读 过 本 书 早 期 手稿 的 人 一 样 ， 禁 不 住 要 发 问 :“ 我 们 怎样 才能 避免 C 语音 
中 的 这 些 问题 呢 ? ” 

也 许 最 重要 的 规避 技巧 就 是 ， 知 道 自己 在 做 什么 。 最 令 人 生 厌 的 问题 都 来 自 
那些 看 起 来 能 工作 ， 其 实 却 潜藏 着 Bug 的 程序 。 正 因为 这 些 问题 潜伏 不 露 ， 要 检 
测 它 们 最 容易 的 办 法 就 是 事前 周密 思考 。 拿 到 一 个 程序 不 加 思索 、 动 手 就 做 ， 使 
之 能 运行 起 来 就 万 事 大 吉 。 可 以 肯定 ， 这 样 得 到 的 只 是 一 个 “几乎 能 工作 ”的 程 
序 。 

关于 这 一 点 ， 就 我 所 知 范围 内 ， 道 理 说 得 最 透彻 的 应 该 是 我 在 一 本 大 键 压 制 
作 手 册 上 读 到 的 一 段 话 。 这 段 话 的 作者 是 David Jacques Way， 他 深 说 对 知识 充满 
自信 的 重要 。 承 蒙 David 惠 多 ， 我 将 这 段 话 摘录 如 下 : 

“思考 ”是 一 切 错 误 之 源 ; 我 可 以 轻易 地 举 出 事实 来 证 明 这 一 点 : 犯 了 错 的 
人 总 是 会 说 ，“ 哦 ， 可 是 我 原 以 为 ......” 只 要 大 键 琴 的 各 种 部 件 还 没有 丫 合 到 一 
起 ， 你 就 应 该 反复 思考 直到 真正 理解 ， 这 种 “思考 ”是 无 妨 的 。 你 应 该 在 不 用 粘 
合剂 的 情况 下 把 所 有 的 部 件 拼装 起 来 〈 称 为 演习 或 排练 ) ， 研 究 它 们 是 如 何 接合 
的 ， 并 与 装配 图 仔细 对 照 。 


在 你 把 某 些 部 件 粘 合 起 来 之 后 本 还 太 访 二 稚 查 一 遍 。 我 听 过 很 多 次 这 种 不 幸 
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的 故事 : “ 昨 晚 我 做 了 什么 什么 ， 可 是 今天 早上 我 再 看 就 ……” 

亲爱 的 制作 者 ， 如 果 你 昨 晚 就 好 好 看 了 的 话 ， 那 么 你 可 能 已 经 把 不 合适 的 部 
件 拆 下 来 重新 装 好 了 。 很 多 制作 者 是 利用 业余 时 间 来 动手 DIY 一 个 大 键 琴 ， 所 以 
经 常 忍 不 住 要 干 到 深夜 。 但 是 ， 根 据 我 接听 求助 电话 的 经 验 ， 大 多 数 错误 都 出 在 
制作 者 在 上 床 睡觉 之 前 做 的 最 后 一 件 工 作 。 所 以 , 在 你 准备 最 后 做 一 点 什么 之 前 ， 
还 是 早点 休息 吧 。 

上 面 这 段 文 字 中 的 “把 所 有 的 部 件 用 粘 合剂 拼装 起 来 ”可 以 与 程序 设计 中 “把 
多 个 小 的 部 分 组 合成 一 个 较 大 的 程序 ” 相 类 比 。 这 样 类 比 之 后 ， 上 面 文字 中 的 建 
议 用 于 程序 设计 就 再 贴切 不 过 了 。 在 实际 组 合 程序 之 前 想 清楚 应 该 如 何 组 合 ， 对 
得 到 一 个 可 靠 的 结果 至 关 重 要 。 


在 面临 时 间 正 力 的 情况 下 ， 对 程序 组 合 方式 的 理解 尤为 重要 。 编 程 者 几乎 都 
有 过 这 样 的 经 历 :在 调试 程序 很 长 时 间 之 后 ， 疲 惫 不 堪 的 程序 员 开 始 漫 无 目的 地 
里 磁 ， 这 里 斌 一下， 那里 改 一 点 ， 如 果 竣 巧 程序 似乎 可 以 运行 了 ， 便 万 事 大 吉 。 
这 种 工作 方式 往往 最 后 导致 一 场 灾难 ! 


8.1 建议 


关于 如 何 减少 程序 错误 ， 下 面 还 有 一 些 通 用 的 建议 : 

不 要 说 服 自 己 相信 “皇帝 的 新 装 ”。 有 的 错误 极 具 伪装 性 和 欺骗 性 。 例如， 本 
书 1.1 节 中 的 例子 与 出 现在 作为 本 书 最 初 原型 的 那 篇 技术 报告 中 的 例子 ， 有 一 些 
细微 的 差别 ， 原 来 的 例子 是 这 样 写 的 : 

while (c == '\t' Il1c= "||lc -== '\n') 


C = getc(f); 


如 上 ， 这 个 例子 在 C 语言 中 是 非法 的 。 因 为 赋值 运算 符 = 的 优先 级 比 while 
子 句 中 其 他 运算 符 的 优先 级 都 要 低 ， 因 此 上 例 可 以 这 样 解释 : 


while ((c == '\t' jl|c = ("||lc == '\n')) 
C = getc(f); 


当然 ， 这 是 非法 的 : 


(EJS NG | ey 
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不 能 出 现在 赋值 运算 符 的 左 侧 。 数 以 千 计 的 人 读 过 这 个 例子 ， 但 是 却 没 有 人 注意 
到 其 中 的 错误 ， 直 到 最 后 Rob Pike 为 我 指 了 出 来 。 


从 我 开始 写作 本 书 起 ， 直 到 最 后 接近 完稿 的 时 候 ， 我 一 直 没 有 去 注意 读者 对 
那 篇 技术 报告 的 评论 。 因 此 ， 上 面 这 个 错误 的 例子 就 留 在 了 手稿 中 ， 手 稿 先 是 在 
贝尔 实验 室内 部 审阅 , 后 来 Addison-Wesley 出 版 社 又 将 该 书 手稿 送出 外 审 。 但 是 ， 
没有 一 个 审阅 者 注意 到 这 个 错误 。 

直截了当 地 表明 意图 。 当 你 编写 代码 的 本 意 是 希望 表达 某 个 意思 ， 但 这 些 代 
码 有 可 能 被 误解 为 另 一 种 意思 时 ， 请 使 用 括号 或 者 其 他 方式 让 你 的 意图 尽 可 能 清 
楚 明 了 。 这 样 做 不 仅 有 助 于 你 日 后 重读 程序 时 能 够 更 好 地 理解 自己 的 用 意 ， 也 方 
便 了 其 他 程序 员 日 后 维护 你 的 代码 。 


有 时 候 我 们 还 应 该 预料 哪些 错误 有 可 能 出 现 ， 在 代码 的 编写 方式 上 做 到 事先 
预防 ， 一 旦 错误 真正 发 生 能 够 马上 捕获 。 例 如 ， 有 的 程序 员 把 常量 放 在 判断 相等 
的 比较 表达 式 的 左 侧 。 换 言 之 ， 不 是 按照 习惯 的 写法 : 

while (¢ == '\t' || c=='"' ||c :== '\n') 

C = getclf); 
而 是 写作 : 
while {'\t' == CIIl' "==c || '\n' == C) 
C = getcl(f}); 

这 样 ， 如 果 程序 员 不 小 心 把 比较 运算 符 == 写 成 了 赋值 运算 符 = ， 编 译 器 将 会 
捕获 到 这 种 错误 ， 并 给 出 一 条 编译 器 诊断 信息 : 

while {'\t' =cll' "==¢ 1| '\n' == C) 


C = getclf}; 


上 面 的 代码 试图 给 字符 常量 \ 赋值 ， 因 而 是 非法 的 。 


考查 最 简单 的 特例 。 无 论 是 构思 程序 的 工作 方式 , 还 是 测试 程序 的 工作 情况 ， 
这 一 原则 都 是 适用 的 。 当 部 分 输入 数据 为 空 或 者 只 有 一 个 元 素 时 ， 很 多 程序 都 会 
执行 失败 ， 其 实 这 些 情 况 应 该 是 一 早 就 应 该 考虑 到 的 。 


这 一 原则 还 适用 于 程序 的 设计 。 在 设计 程序 时 ， 我 们 可 以 首先 考虑 一 组 输入 
数据 全 为 空 的 情形 ， 从 最 简单 的 特例 获得 启发 。 


使 用 不 对 称 边 界 。 本 书 3.6 节 关 于 如 何 表 示 取 值 范围 的 讨论 ， 值 得 一 读 再 读 。 
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C 语言 中 数组 下 标 取 值 从 0 开始 , 各 种 计数 错误 的 产生 与 这 一 点 或 多 或 少 有 关系 。 
我 们 一 旦 理解 了 这 个 事实 ， 处 理 这 些 计数 错误 就 变 得 不 那么 困难 了 。 


注意 潜伏 在 暗 处 的 Bug。 各 种 C 语言 实现 之 间 ， 都 存在 着 或 多 或 少 的 细微 差 
别 。 我 们 应 该 坚持 只 使 用 C 语言 中 众所周知 的 部 分 ， 而 避免 使 用 那些 “生僻 ”的 
语言 特性 。 这 样 做 ， 我 们 能 够 很 方便 地 将 程序 移植 到 一 个 新 的 机 器 或 编译 器 ， 而 
且 “ 遭 遇 ” 到 编译 器 Bug 的 可 能 性 也 会 大 大 降低 。 


例如 ， 回 想 一 下 本 书 3.1 节 关 于 数组 与 指针 的 讨论 ， 因 为 很 多 问题 和 事项 尚 
不 确定 ， 讨 论 无 法 深入 下 去 ， 不 得 不 就 此 打住 。 任 何 一 个 程序 ， 如 果 它 必须 依赖 
特定 的 C 语言 实现 来 保证 诸多 细节 的 正确 性 ， 那 么 很 可 能 在 某 个 时 候 无 法 工作 。 


对 那些 细节 处 的 考虑 有 从 周到 的 函数 库 实现 ， 我 们 在 编码 的 时 候 要 预先 采取 
某 些 防 备 性 的 措施 。 有 一 次 ， 我 在 将 一 个 程序 从 某 个 机 型 移植 到 另 一 个 机 型 时 ， 
遇 到 了 很 大 的 麻烦 。 最 后 发 现 原因 是 程序 中 调用 printf 库 函 数 时 ， 默 认 假设 其 格 
式 字符 串 的 长 度 可 以 达到 几 千 个 字符 长 度 。 当 然 ， 这 个 假设 并 没有 什么 错 ， 只 是 
某 些 C 语言 实现 中 的 printf 库 函 数 无 法 处 理 这 么 长 的 格式 字符 串 。 


在 你 准备 使 用 某 些 只 被 特定 厂商 的 产品 所 支持 的 特性 时 ， 这 个 建议 就 显得 尤 
为 重要 。 记 住 ， 程 序 的 生命 期 往往 要 长 于 它 运 行 其 上 的 机 器 的 生命 期 


防御 性 编程 。 对 程序 用 户 和 编译 器 实现 的 假设 不 要 过 多 ! 我 还 记得 自己 在 开 
发 某 个 系统 时 ， 曾 经 与 一 个 用 户 有 过 这 样 一 场 对 话 ; 

“这 部 分 记录 中 可 能 出 现 的 代码 有 哪些 ? ” 

“可 能 的 代码 是 X、Y 和 ZZ。” 

“如 果 与 X、Y 和 艺 不 同 的 代码 在 这 里 出 现 ， 该 怎么 办 昵 ?” 

“这 不 可 能 发 生 。” 

“ 嗯 , 但 如 果 这 种 情况 确实 发 生 时 ,程序 需要 做 些 适 当 的 处 理 。 你 认为 程序 应 
该 做 些 什么 呢 ? ” 

“这 个 我 可 不 关心 。” 

“你 真 的 不 关心 ? ” 

4 对 。” 
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“那么 ， 如 果 程 序 在 检测 到 不 同 于 X、Y 和 Z 的 代码 出 现时 删除 整个 数据 库 ， 
你 也 不 会 介意 吗 ?” 

“ 太 荒 唐 了 。 你 绝对 不 能 删除 整个 数据 库 ! 

“ 那 就 是 说 ， 你 还 是 介意 程序 在 这 种 情况 下 的 行为 。 那 么 ， 你 希望 程序 做 些 什 
么 呢 ? ” 

我 们 知道 ， 再 怎么 不 可 能 发 生 的 事情 ， 某 些 时 候 还 是 有 可 能 发 生 的 。 一 个 健 
壮 的 程序 应 该 预先 考虑 到 这 种 异常 情况 。 

如 果 C 编译 器 能 够 捕获 到 更 多 的 编程 错误 ， 这 当然 不 错 。 不 幸 的 是 ， 因 为 几 
方面 的 原因 ， 要 做 到 这 一 点 很 困难 。 最 重要 的 原因 也 许 是 历史 因素 : 长 期 以 来 ， 
人 们 惯 于 用 C 语言 来 完成 以 前 用 汇编 语言 做 的 工作 。 因 此 , 许多 C 程序 中 心 有 这 
样 的 部 分 ， 刻 意 去 做 那些 严格 说 来 在 C 语言 所 允许 范围 以 外 的 工作 。 最 明显 的 例 
子 就 是 类 似 操 作 系统 的 东西 。 这 样 ， 一 个 C 编译 器 要 做 到 严格 检测 程序 中 的 各 种 
错误 ， 就 要 对 程序 中 本 意 是 可 移植 的 部 分 做 到 严格 检测 ， 同 时 对 程序 中 那些 需要 
完成 与 特定 机 器 相关 工作 的 部 分 网 开 一 面 。 

另 一 个 原因 是 , 某 些 类 型 的 错误 从 本 质 上 说 是 难于 检测 的 。 考虑 下 面 的 消 数 : 

void set(int *p, int n) { 

“p= n; 

} 

这 个 函数 是 合法 还 是 非法 ? 离开 一 定 的 上 下 文 ， 我 们 当然 不 可 能 知道 答案 。 
如 果 像 下 面 的 代码 一 样 调用 这 个 函数 ， 

int a[l10}; 

set (a+5, 37); 

这 当然 是 合法 的 ， 但 如 果 这 样 来 调用 set 函数 : 

int al[l1l0]; 

set (a+10, 37); 

上 面 的 代码 就 是 非法 的 了 .ANSI C 标准 允许 程序 得 到 数组 尾 端 出 界 的 第 一 个 位 置 
的 地 址 ， 因 此 上 面 的 后 一 个 代码 段 从 它 本 身 来 说 并 没有 什么 错误 。C 编译 器 要 想 
捕获 到 这 样 的 错误 ， 就 必须 非常 地 “聪明 ”。 

但 是 并 不 是 说 ，C 编译 器 要 检测 到 范围 更 广 的 程序 错误 是 不 可 能 的 。 这 不 仅 
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有 可 能 ， 而 且 事实 上 市 场 上 已 经 有 了 一 些 这 样 的 编译 器 。 但 是 ， 任 何 C 语言 实现 
都 无 法 捕获 到 所 有 的 程序 错误 。 


8.2 ”答案 


练习 0-1。 你 是 否 愿 意 购买 一 个 返修 率 很 高 的 三 家 所 生产 的 汽车 ?” 如果 厂家 
声明 它 已 经 作出 了 改进 ， 你 的 态度 是 否 会 改变 ? 用 户 为 你 找 出 程序 中 的 Bug， 你 
真正 损失 的 是 什么 ? 

我 们 之 所 以 选择 一 种 产品 而 不 选择 另 一 种 产品 ， 其 中 一 个 重要 的 考虑 因素 就 
是 厂商 的 信誉 。 如 果 信 誉 一 旦 失去 ， 就 很 难 重 新 获得 。 我 们 需要 认真 思考 ， 企 业 
最 近 产 品 的 高 质量 是 真实 的 ， 还 是 纯 属 偶然 。 


大 多 数 人 们 在 已 经 知道 一 个 产品 有 可 能 存在 重大 设计 缺陷 时 ， 不 会 去 购买 这 
个 产品 一 一 除非 这 是 一 个 软件 产品 。 很 多 人 写 过 一 些 给 其 他 人 用 的 程序 。 人 们 对 
软件 产品 不 能 工作 已 经 习以为常 、 见 怪 不 怪 。 我 们 应 该 用 产品 的 高 质量 来 让 这 些 
人 人 大吃一惊。 

练习 0-2， 修建 一 个 100 英尺 长 的 护栏 ,护栏 的 栏杆 之 间 相 距 10 英尺 ， 你 需 
要 多 少 根 栏杆 ? 


11 根 。 围 栏 一 共 分 成 10 段 ， 但 栏杆 却 需 要 11 根 。 请 亲自 数 一 数 。 本 书 3.6 
节 讨 论 了 这 个 问题 与 一 类 常见 的 程序 设计 错误 的 关系 。 





练习 0-3。 在 亮 饪 时 你 是 否 失手 用 菜刀 切 伤 过 自己 的 手 ? 怎样 改进 菜刀 使 得 
使 用 更 安全 ? 你 是 否 愿意 使 用 这 样 一 把 经 过 改良 的 菜刀 ? 


我 们 很 容易 想到 办 法 让 一 个 工具 更 安全 ， 代 价 是 原来 简单 的 工具 现在 要 变 得 
复杂 一 些 。 食 品 加 工 机 一 般 有 连锁 装置 ， 保 护 使 用 者 不 让 手指 受伤 。 但 是 菜刀 却 
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不 同 ， 给 这 样 一 个 简单 、 灵 活 的 工具 附加 保护 手指 避免 受伤 的 装置 ， 只 能 让 它 失 
去 简单 灵活 的 特点 。 实 际 上 ， 这 样 做 最 后 得 到 的 也 许 更 像 一 台 食品 加 工 机 ， 而 不 
是 一 把 菜刀 。 

使 其 难于 做 “ 傻 事 ”常常 会 使 其 难于 做 “聪明 事 "”， 正 所 谓 “弄巧成拙 ”。 

练习 1L1。 某 些 C 编译 器 允许 嵌 套 注释 。 请 写 一 个 测试 程序 ， 要求， 无 论 是 
对 人 允许 嵌 套 注释 的 编译 器 ， 还 是 对 不 允许 嵌 套 注释 的 编译 器 ， 该 程序 都 能 正常 通 
过 编译 (无 错误 消息 出 现 )， 但 是 这 丙种 情况 下 程序 执行 的 结果 却 不 相同 。 

(提示 : 在 用 引号 括 起 来 的 字符 串 中 ， 注 释 符 /# 属于 字符 串 的 一 部 分 ， 而 在 
注释 中 出 现 的 双 引号 ”又 属于 注释 的 一 部 分 。) 

为 了 判断 编译 器 是 否 允 许 嵌 大 注释， 必须 找到 这 样 一 组 符号 序列 ， 无 论 是 对 
于 允许 人 套 注释 的 编译 器 ， 还 是 不 允许 代 套 注释 的 编译 器 ， 它 都 是 合法 的 ; 但 是 ， 
对 于 两 类 不 同 的 编译 器 ， 它 却 意 味 着 不 同 的 事物 。 这 样 一 组 符号 序列 不 可 避免 地 
要 涉及 杠 套 注释 ， 让 我 们 从 这 里 开始 讨论 : 

si Bi 

对 于 一 个 允许 嵌 套 注释 的 C 编译 器 ， 无论 上 面 的 符号 序列 后 面 眼 什么 ， 者 属 
于 注释 的 一 部 分 ， 而 对 于 不 允许 符 套 注释 的 C 编译 器 ， 后 面 跟 的 就 是 实 实在 在 的 
代码 内 容 ,也 许 有 人 因此 想到 可 以 在 后 面 再 跟 一 个 用 一 对 引号 引起 的 注释 结束 符 

1 证/ 太太/ 网 7 

如 果 允 许 嵌 套 注释 ， 上 面 的 符号 序列 就 等 效 于 一 个 引号 ;如果 不 允许 ， 那 么 
就 等 效 于 一 个 字符 串 "*/"。 因 此 ， 我 们 可 以 接着 在 后 面 跟 一 个 注释 开始 符 以 及 一 
个 引号 ; 

Fa A A A A 

如 果 人 允许 嵌 套 注释 ， 上 面 就 等 效 于 用 一 对 引号 引起 的 注释 开始 符 %*"， 如 果 
不 允许 ， 那 么 就 等 效 于 一 个 用 引号 括 起 的 注释 结束 符 ， 后 跟 一 段 未 结束 的 注释 。 
我 们 可 以 简单 地 让 最 后 的 注释 结束 ; 

/A*/xxf "uf" fan /ww)] 

这 样 ， 如 果 允 许 嵌 套 注释 ， 上 面 的 表达 式 就 等 效 于 "*/"， 如 果 不 允许 ， 那 么 
就 等 效 于 "/*"。 
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在 我 用 基本 上 类 似 于 上 面 的 形式 解决 这 个 问题 之 后 ，Doug Mcllroy 发 现 了 下 
面 这 个 让 人 拍案 叫绝 的 解法 : 

A*/*/O*/**/l 

这 个 解法 主要 利用 了 编译 器 作词 法 分 析 时 的 “大 嘴 法 ”规则 。 如 果 编 译 器 允 
许 娆 套 注释 ， 则 上 式 将 被 解释 为 : 

7/ 

两 个 /* 符 号 与 两 个 */ 符 号 正好 匹配 ， 所 以 上 式 的 值 就 是 1。 如 果 不 允 许 赃 套 注 
释 ， 注 释 中 的 /* 将 被 和 忽略。 因此， 即使 是 /出 现在 注释 中 也 没有 特殊 的 含义 ， 上 面 
的 表达 式 因此 将 被 这 样 解释 ;: 

jx /0 /rx 1 
它 的 值 就 是 0*1， 也 就 是 0。 

练习 1-2. 如 果 由 你 来 实现 一 个 C 编译 器 ， 你 是 否 会 允许 骨 套 注释 ? 如 果 你 
使 用 的 C 编译 器 允许 嵌 套 注释 ， 你 会 用 到 编译 器 的 这 一 特性 吗 ? 你 对 第 二 个 问题 
的 回答 是 否 会 影响 到 你 对 第 一 个 问题 的 回答 ? 

冬 套 注释 对 于 暂时 移 除 一 块 代码 很 有 用 : 在 这 块 代码 之 前 加 上 一 个 注释 开始 
符 ， 在 代码 之 后 加 上 一 个 注释 结束 符 ， 就 一 切 OK 了 。 然 而 ， 这 样 做 也 有 缺点 ; 
如 果 用 注释 的 方式 从 程序 中 移 除 一 大 块 代码 ， 很 容易 让 人 注意 不 到 代码 已 经 被 移 
除了 。 

但 是 ，C 语言 定义 并 不 允许 嵌 套 注释 ， 因 此 一 个 完全 遵守 C 语言 标准 的 编译 
器 就 别 无 其 他 选择 了 。 而 且 ， 一 个 编程 者 如 果 依 赖 髓 套 注释 ， 那 么 他 所 得 到 的 程 
序 在 很 多 编译 器 上 将 无 法 通过 。 这 样 ， 任 何 嵌 套 注 释 的 使 用 ， 不 可 避免 地 只 能 限 
制 在 那些 不 准备 以 源 代 码 形式 分 发 的 程序 之 中 。 而 且 ， 在 新 的 C 语言 实现 上 ， 或 
者 当 原 来 的 C 语言 实现 有 了 改动 时 ， 这 样 的 程序 还 将 有 不 能 运行 的 风险 。 

因为 这 些 原因 , 如 果 让 我 来 编写 一 个 C 编译 器 , 我 将 不 会 选择 实现 嵌 套 注释 ; 
而 且 ， 即 使 我 所 用 的 编译 器 允许 峰 套 注释 ， 我 也 不 会 在 程序 中 用 到 这 一 特性 。 当 
然 ， 最 终 的 决定 还 是 应 该 由 读者 自己 作出 。 


练习 1-3。 为 什么 n-->0 的 含义 是 n-- > 0， 而 不 是 m -> 0? 
根据 “大 嘴 法 ”规则 ， 在 编译 器 读 入 > 之 前 ， 就 已 经 将 -- 作 为 单个 符号 了 。 
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练习 1-4。 a+++++b 的 含义 是 什么 ? 
上 式 惟一 有 意义 的 解析 方式 是 : 

a ++ + ++ 了 

可 是 ， 我 们 也 注意 到 ， 根 据 “ 大 嘴 法 ”规则 ， 上 式 应 该 被 分 解 为 : 

a ++ ++ + 了 

这 个 式 子 从 语法 上 来 说 是 不 正确 的 ， 它 等 价 于 : 

((a++)++) + b 
但 是 ，a++ 的 结果 不 能 作为 左 值 ， 因 此 编译 器 不 会 接受 a++ 作 为 后 面 的 ++ 运 算 符 
的 操作 数 。 这 样 ， 如 果 我 们 遵循 了 解析 词法 二 义 性 问题 的 规则 ， 上 例 的 解析 从 语 
法 上 来 说 又 没有 意义 。 当 然 ， 在 编程 实践 中 ， 谨 慎 的 做 法 就 是 尽量 避免 使 用 类 似 
的 结构 ， 除 非 编程 者 非常 清楚 这 些 结构 的 含义 。 

练习 2-1，C 语言 允许 初始 化 列表 中 出 现 多 余 的 去 号 ， 例 如 : 

int days[] = { 31, 28, 31, 30, 31, 30, 


31, 31, 30, 31, 30, 31,}; 
为 什么 这 种 特性 是 有 用 的 ? 
我 们 可 以 把 上 例 的 缩 排 格 式 稍 作 改动 如 下 : 
int days[] = { 
a1 285 31, 307 31 .30; 
3 BL -007.2 B30 Bs 
}; 
现在 我 们 可 以 很 容易 看 出 ， 初 始 化 列表 的 每 一 行 都 是 以 逗号 结尾 的 。 正 因为 每 一 
行 在 语法 上 的 这 种 相似 性 ， 自 动 化 的 程序 设计 工具 例如， 代码 编辑 器 等 ) 才能 
够 更 方便 地 处 理 很 大 的 初始 化 列表 。 


练习 2-2。 本 章 的 第 3 节 指 出 了 在 C 语言 中 以 分 号 作为 语句 结束 的 标志 而 带 
来 的 一 些 问题 。 虽 然 我 们 现在 考虑 改变 语言 的 这 个 规定 已 经 太 迟 了 ,但 是 设想 
一 下 分 隔 语句 是 否 还 有 其 他 办 法 却 是 一 件 饶 有 趣味 的 事情 。 其 他 语言 中 是 如 何 分 
隔 语句 呢 ? 这 些 方法 是 否 也 存在 它们 固有 的 缺陷 昵 ? 

Fortran 与 Snobol 语言 中 ， 语 句 随 着 代码 行 的 结束 而 自然 结束 ， 这 两 种 语言 
都 允许 一 个 语句 跨 多 个 代码 行 ， 只 要 在 语句 的 第 二 行 以 及 后 续 各 行 有 明确 的 指示 
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标志 即 可 。 在 Fortran 语言 中 , 这 个 指示 标志 就 是 在 代码 行 的 字符 位 置 6 上 出 现 非 
空白 字符 (代码 行 的 字符 位 置 0 一 5 己 预 留 给 语句 标号 )。 在 Snobol 语言 中 ， 这 个 
指示 标志 就 是 在 代码 行 的 字符 位 置 | 出 现 一 个 . 或 者 + 符号 。 


一 个 代码 行 的 含义 要 受到 其 后 续 代 码 行 的 影响 , 这 一 点 多 少 显得 有 些 “ 怪 异 ”。 
因此 ， 某 些 程序 语言 改 为 在 第 n 行 代码 中 使 用 某 种 指示 标志 ， 以 表示 第 n+l 行 代 
码 应 该 被 当 作 同 一 个 语句 的 一 部 分 。 例 如 ，Unix 系统 的 Shell (如 bash、ksh、csh 
等 ) 在 代码 行 的 结尾 使 用 字符 \ 来 作为 指示 标志 ， 表 示 下 一 个 代码 行 是 同一 个 语 
句 的 一 部 分 。C 语言 在 预 处 理 器 中 以 及 字符 串 内 部 , 沿用 了 Unix 系统 中 的 这 一 惯 
例 。 其 他 语言 ， 例 如 Awk 和 Ratfor， 只 要 一 个 代码 行 结 束 时 还 有 从 语法 上 来 说 需 
要 补足 的 不 完整 部 分 ， 例 如 一 个 运算 符 〈 要 求 后 面 跟 一 个 操作 数 ) 或 者 一 个 左 括 
号 (要求 后 面 出 现 相应 的 右 括号 ), 那么 语句 就 被 视 为 自然 地 扩展 到 了 下 一 个 代码 
行 。 这 种 处 理 方式 虽然 难于 严格 定义 ， 但 在 编程 实践 中 应 用 起 来 似乎 并 无 大 碍 。 


练习 3-1。 假定 对 于 下 标 越界 的 数组 元 素 即 使 取 其 地 址 也 是 非法 的 ， 那 么 本 
书 3.6 节 中 的 bufwrite 程序 应 该 如 何 写 呢 ? 


bufwrite 程序 实际 上 隐 含 了 这 样 一 个 假定 :即使 在 缓冲 区 完全 填 满 时 ,bufwrite 
函数 也 仍然 可 以 返回 ， 而 留待 下 一 次 bufwrite 函数 被 调用 时 再 刷新 。 如 果 指 针 变 
量 bufptr 不 能 指向 缓冲 区 以 外 的 位 置 ， 这 个 问题 就 突然 变 得 棘手 起 来 ， 我们 应 该 
如 何 指示 缓冲 区 已 满 这 种 情形 呢 ? 

最 不 麻烦 的 解决 方案 似乎 是 ， 避 免 在 缓冲 区 已 满 时 从 bufwrite 函数 中 返回 。 
要 做 到 这 一 点 ， 我 们 就 要 把 最 后 一 个 进入 缓冲 区 的 字符 作为 特例 处 理 。 


除非 我 们 已 经 知道 指针 p 指向 的 并 不 是 某 个 数组 的 最 后 一 个 元 素 , 否则 的 话 ， 
我 们 必须 避免 对 p 进行 递增 操作 。 也 就 是 说 ， 在 最 后 一 个 输入 字符 被 送 进 缓冲 区 
之 后 ， 我 们 就 不 应 该 再 递增 p 了 。 此 处 ， 我 们 是 通过 在 循环 的 每 次 迭代 中 增加 一 
次 额外 的 测试 来 做 到 这 一 点 的 ， 另 一 种 可 选 的 方案 就 是 重复 整个 循环 。 
void bufwrite(char *p, int n) { 
while {--n >= 0) { 
if (bufptr == &buffer[N-1]) { 
*bufptr = *p; 
flushbuffer(); 


} else 
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*bufptr++ = *p; 
D++; 


} 
读者 可 能 注意 到 了 ， 这 里 我 们 小 心 责 贾 地 避免 在 缓冲 区 填 满 时 对 bufptr 进行 
递增 操作 ， 是 为 了 不 会 生成 非法 地 址 buffer[N]。 
bufwrite 程序 的 第 二 个 版 本 改 起 来 就 更 加 棘手 了 。 在 进入 程序 时 ， 我 们 知道 
缓冲 区 中 至 少 还 有 一 个 字符 的 位 置 尚未 填 满 ， 因 此 一 开始 我 们 并 不 需要 清空 缓冲 
区 ; 但 是 ， 在 程序 结束 时 ， 我 们 就 有 可 能 需要 清空 缓冲 区 了 。 与 对 bufwrite 程序 
的 第 一 个 版 本 的 处 理 相 同 ， 我 们 在 循环 的 最 后 一 次 迭代 时 也 必须 避免 对 p 进行 递 
增 操作 :; 
void bufwrite(char *p, int n) { 
while (n > 0) { 
int k, rem; 
rem =N - (bufptr - buffer); 
k= n> rem? rem: n; 


memcpy (bufptr, p, k); 


if (k == rem) 
flushbuffer(); 
else 
bufptr += k; 
n -= k 
if (n) 
p += K 


} 

我 们 把 与 rem 进行 比较 ， 前 者 是 本 次 循环 迭代 中 我 们 需要 复制 的 字符 数 ， 
后 者 是 缓冲 区 中 尚未 填 满 的 字符 数 。 这 个 比较 的 目的 是 看 在 复制 操作 后 缓冲 区 是 
否 已 经 填 满 ， 如 果 缓 冲 区 已 满 则 需要 清空 。 在 对 p 进行 递增 操作 之 前 ， 我 们 首先 
检查 n 是 否 为 0， 以 判断 本 次 迭代 是 否 为 循环 的 最 后 一 次 迭代 。 


练习 3-2.。 比较 本 书 3.6 节 函 数 flush 的 最 后 一 个 版 本 与 以 下 版 本 : 
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void flush() { 
int row; 
int k = bufptr - buffer; 
if (Kk > NROWS) 
k = NROWS; 
for (row = 0; row < k; row++) { 
了 也 七 *p; 
for (p= buffer + row; p< bufptr; p += NROWS) 
printnum(*p); 
printnl (); 
} 
if (k > 0) 
printpage(); 
} 


flush 函数 的 两 个 不 同 版 本 之 间 的 区 别 是 ， 上 面 的 flush 函数 在 测试 k 是 否 大 
于 0 的 语句 中 只 包括 了 对 printpage 函数 的 调用 ， 而 第 3 章 的 flush 函数 在 测试 诸 
名 中 还 包括 了 整个 for 循环 。 第 3 章 的 flush 函数 的 版 本 ， 用 自然 语言 描述 就 是 这 
样 的 :“ 如 果 缓 冲 区 中 有 需要 打印 的 内 容 ， 把 它们 打印 出 来 ， 然 后 开始 新 的 一 页 。 
此 处 的 flush 函数 的 版 本 ， 用 自然 语言 描述 就 是 ,“ 不 管 缓冲 区 中 是 否 有 剩余 的 内 
容 ， 首 先 打印 ， 如 果 缓 冲 区 中 确 有 剩余 ， 则 开始 新 的 一 页 .” 与 第 3 章 中 flush 函 
数 的 版 本 相 比 ， 这 个 版 本 中 的 k 在 for 循环 里 的 作用 就 不 甚 明显 。 在 第 3 章 的 版 
本 中 ， 我 们 可 以 很 容易 看 出 k 的 作用 来 ， 当 k 为 0 时 ， 将 跳 过 循环 。 

虽然 从 技术 上 说 flush 函数 的 这 两 个 版 本 是 等 价 的 , 但 是 它们 所 表达 的 编程 意 
图 却 有 细微 差别 。 最 能 够 反映 程序 员 实 际 编程 意图 的 版 本 ， 就 是 最 好 的 版 本 。 

练习 3-3。 编写 一 个 函数 ， 对 一 个 已 排序 的 整数 表 执行 二 分 查找 。 函 数 的 输 
入 包括 一 个 指向 表 头 的 指针 ， 表 中 的 元 素 个 数 ， 以 及 待 查找 的 数值 。 函 数 的 输出 
是 一 个 指向 满足 查找 要 求 的 元 素 的 指针 ， 当 未 查找 到 要 求 的 数值 时 ， 输 出 一 个 
NULL 指针 。 

二 分 查找 从 概念 上 来 说 非常 简单 ， 但 是 编程 实践 中 人 们 经 常 不 能 正确 实现 。 
这 里 ， 我 们 将 开发 出 二 分 查找 的 两 个 版 本 ， 它 们 都 用 到 了 不 对 称 边 界 。 第 一 个 版 
本 用 的 是 数组 下 标 ， 第 二 个 版 本 用 的 是 指针 。 
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不 妨 假定 待 搜 索 的 元 素 为 x， 如 果 x 存在 于 数组 中 的 话 ， 那 么 我 们 假定 它 
在 数组 中 的 下 标 为 k。 最 开始 ， 我 们 仅仅 知道 0<= k < n 。 我 们 的 目标 是 不 断 
缩小 k 的 取 值 范围 ， 直 到 找到 要 搜索 的 元 素 ， 或 者 能 够 判定 数组 中 不 存在 这 样 
的 元 素 。 

为 了 做 到 这 一 点 ， 我 们 把 x 与 位 于 可 能 范围 中 间 位 置 的 元 素 进行 比较 。 如 果 
x 与 该 元 素 相 等 ， 那 我 们 就 大 功 告 成 。 如 果 两 者 不 相等 ， 位 于 该 元 素 的 “错误 ” 
一 侧 的 所 有 元 素 ， 我 们 就 可 以 不 予 考虑 ， 从 而 缩小 了 我 们 搜索 的 范围 。 图 8-1 显 
示 了 搜索 过 程 中 的 情况 ; 


0 lo k hi n 
图 8-1 二 分 查找 示意 图 


任何 时 候 ， 我 们 都 假定 lo 和 hi 是 不 对 称 边 界 的 两 头 。 也 就 是 说 ， 我 们 要 求 
lo<= k <hi。 如 果 lo 与 hi 相等 ， 此 时 可 能 范围 已 经 缩 为 空 ， 我 们 就 能 判定 x 不 在 
表 中 。 

如 果 lo 小 于 hi， 那 么 可 能 范围 中 至 少 存在 一 个 元 素 。 我 们 不 妨 设 定 mid 
为 可 能 范围 的 中 值 , 然后 比较 x 与 表 中 下 标 为 mid 的 元 素 。 如 果 x 比 该 元 素 小 ， 
那么 mid 就 是 位 于 可 能 范围 以 外 的 最 小 下 标 ， 因 此 我 们 可 以 设置 hi = mid。 如 
果 x 比 该 元 素 大 ,那么 mid+1 就 是 位 于 新 的 已 缩减 的 可 能 范围 以 内 的 最 小 下 标 ; 
因此 ， 我 们 可 以 设置 lo = mid+1。 最 后 ， 如 果 x 与 该 元 素 相等 ， 那 么 我 们 就 完 
成 了 搜索 。 

我 们 是 否 可 以 设置 mid = (hi + loM2， 这 样 设置 会 带 来 什么 问题 吗 ? 如 果蔬 与 
lo 相隔 较 远 ， 这 样 做 显然 不 会 有 什么 问题 。 但 是 ， 如 果 hi 与 lo 隔 得 很 近 又 是 怎 
样 的 情况 呢 ? 

hi 等 于 lo 的 情况 根本 用 不 着 考虑 ,因为 此 时 我 们 已 经 知道 x 的 可 能 范围 为 空 ， 
我 们 甚至 不 需要 设置 mid。 当 hi = lo+2 时 , 这 也 不 是 问题 : hi + lo 等 于 2Xlo+2， 
这 是 一 个 偶数 ， 因 此 (hi + 10)/2 等 于 lo + 1。 当 二 =1o+1 时， 情况 又 如 何 呢 ? 在 
这 种 情况 下 ， 可 能 范围 中 的 惟一 元 素 就 是 lo， 因 此 如 果 (hi + lo)/2 等 于 lo， 这 个 结 
果 才 是 我 们 可 接受 的 。 
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幸运 的 是 ,由 于 hi + lo 恒 为 正 数 ，(hi + lo)/2 会 得 到 我 们 希望 的 结果 lo。 因 为 
在 这 种 情况 下 ， 整 数 除 法 肯定 将 会 被 截断 处 理 。 因 此 ，(hi + lo)/2 等 价 于 ((lo + 
1)+loY2， 亦 即 (2Xlo+1)/2， 这 个 式 子 的 结果 就 是 io。 


根据 上 面 的 讨论 ， 这 个 程序 大 致 如 下 : 


int * bsearch(int *t, int n, int x) { 
int lo = 0, hi = n; 
while (lo < hi) { 
int mid = {hi + lo) / 2; 
if {x < t[mid]) 
hi = mid; 
else if (x > t[mid]) 
lo = mid + 1; 
else 
return t + mid; 
} 
return NULLD; 


值得 注意 的 是 ， 下 面 求 值 表 达 式 : 
int mid = (hi + lo) / 2; 
中 的 除法 运算 可 以 用 移 位 运算 代替 ， 
int mid = (hi + 10o) >> 1; 
这 样 做 确实 会 提高 程序 的 运行 速度 。 现 在 还 是 让 我 们 首先 去 掉 一 些 寻 址 运 
算 吧 ， 在 很 多 机 器 上 下 标 运算 都 要 比 指针 运算 慢 。 我 们 可 以 把 t+mid 的 值 存储 
在 一 个 局 部 变量 中 ， 这样 就 不 需要 每 次 都 重新 计算 ， 从 而 可 以 稍微 减少 一 些 寻 
址 运算 ; 
int * bsearch(int *t, int n, int x) { 
int lo = 0, hi = n; 
while (lo < hi) { 
int mid = {hi + lo) / 2; 


int *p = 七 + mid; 
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if (x < *p) 
hi = mid; 
else if (x > *p) 
lo= mid + 1; 
else 
return p; 
} 
return NULL; 
} 


又 假定 我 们 希望 进一步 减少 寻 址 运算 ， 这 可 以 通过 在 整个 程序 中 用 指针 代替 
下 标 来 做 到 。 乍 一 看 来 ， 我 们 似乎 只 要 按部就班 地 把 程序 中 凡 用 到 下 标的 地 方 ， 
统统 改 用 指针 的 形式 重 写 一 遍 即 可 : 


int * psearchl(int *t, int n, int x) { 
int xlo = t, *hi = t + n; 
while (lo < hi) { 
int *mid = (hi + lo) / 2; 
if (x < *mid) 
hi = mid; 
else if (x > *mid) 
lo = mid + 1; 
else 
return mid; 
} 
return NULL; 
} 


实际 上 ， 这 个 程序 是 “ 功 败 垂 成 ” 还 差 一 点 就 可 以 工作 了 。 问 题 出 在 下 面 的 
语句 
mid = {lo + hi) / 2; 


这 个 语句 是 非法 的 ， 因 为 它 试图 把 两 个 指针 相 加 。 正 确 的 做 法 是 ， 首 先 计 算出 lo 
与 hi 之 间 的 距离 《这 可 以 由 指针 减法 得 到 ， 并 且 结 果 是 一 个 整数 )， 然 后 把 这 个 
距离 的 一 半 〔 也 仍然 是 整数 》 与 lo 相 加 : 
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mid = lo+ (hi - lo} / 2， 
上 面 的 hi- lo 计算 出 结果 之 后 ， 还 要 对 它 作 除法 运算 。 昌 然 大 多 数 C 编译 
器 都 足够 “智能 ” 会 自动 地 把 这 类 除法 运算 实现 为 移 位 运算 以 优化 程序 性 能 ， 
但 对 于 我 们 这 里 的 除 2 运算 ， 这 些 编译 器 还 不 够 智能 ， 不 会 把 它 实 现 为 移 位 运 
算 。 因 为 编译 器 所 知道 的 只 是 hi - lo 可 能 为 负 ， 而 对 负数 来 说 ， 除 2 运算 和 移 
位 运算 会 得 到 不 同 的 结果 。 因 此 ， 我 们 确实 应 该 自己 手动 把 它 写 成 移 位 运算 的 
形式 : 
mid = lo + (hi - 1o) >> 1; 
很 不 幸 ， 这 样 写 还 是 不 对 。 一 定 要 记 住 移 位 运算 符 的 优先 级 低 于 算术 运算 符 
的 优先 级 ! 因此 ， 我 们 必须 写成 ; 
mid = lo+ ((hi - 1o) >> 1); 
最 后 ， 完 整 的 程序 如 下 : 
int * bsearchl(int *t, int n, int x) f{ 
int *]o = t, *hi =t +n; 
while (lo < hi) { 
int *mid = jo + ((hi - lo) >> 1); 
if (x < *mid) 
hi = mid; 
else if (x > *mid) 
lo = mid + 1; 
else 
return mid; 


} 
return NULL; 


顺便 说 一 下 ， 二 分 查找 经 常用 对 称 边界 来 表达 。 因 为 采用 了 对 称 边界 后 ， 最 
后 得 到 的 程序 看 上 去 要 整齐 许多 : 
int * bsearchl(int *t, int n, int x) { 
int lo = 0, hi =n-1; 
while {lo <= hi) { 
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int mid = (hi + lo} / 2; 
it (x < t[mid]} 
hi = mid - 1; 
else if (x > t[mid]) 
lo = mid + 1; 
else 
return t + mid; 
} 
return NUDLL 


然而 ， 如 果 我 们 试图 把 上 面 的 程序 改写 成 “ 纯 指 针 ” 的 形式 ， 就 会 遇 到 麻烦 。 
问题 在 于 ， 我 们 不 能 把 hi 初始 化 为 t+ n - 1。 因 为 当 n 为 0 时 ， 这 是 个 无 效 地 址 ! 
因此 ， 如 果 我 们 还 想 把 程序 改写 成 指针 形式 ， 就 必须 对 n=0 的 情形 单独 测试 。 这 
从 男 一 个 角度 又 一 次 说 明了 为 什么 应 该 采用 不 对 称 边界 。 

练习 4-1。 假定 一 个 程序 在 一 个 源 文件 中 包含 了 声明 ;: 

long foo; 

而 在 另 一 个 源 文件 中 包含 了 : 

extern short foo; 

又 进一步 假定 ,如果 给 long 类 型 的 foo 赋 一 个 较 小 的 值 , 例如 37， 那么 short 
类 型 的 foo 就 同时 获得 了 一 个 值 37。 我 们 能 够 对 运行 该 程序 的 硬件 作出 什么 样 的 
推断 ? 如 果 short 类 型 的 foo 得 到 的 值 不 是 37 而 是 0， 我 们 又 能 够 作出 什么 样 的 
推断 ? 

如 果 把 值 37 赋 给 long 型 的 foo， 相 当 于 同时 把 值 37 也 赋 给 了 short 型 的 
foo, 那么 这 意味 着 short 型 的 foo, 与 long 型 的 foo 中 包含 了 值 37 的 有 效 位 的 
部 分 ， 两 者 在 内 存 中 占用 的 是 同一 区 域 。 这 有 可 能 是 因为 long 型 和 short 型 被 
实现 为 同一 类 型 ， 但 很 少 有 C 语言 实现 会 这 样 做 。 和 更 有 可 能 的 是 ，long 型 的 
foo 的 低位 部 分 与 short 型 的 foo 共享 了 相同 的 内 存 空间 ， 一 般 情况 下 ， 这 个 部 
分 所 处 的 内 存 地 址 较 低 ; 因此 我 们 的 一 个 可 能 推论 就 是 ， 运 行 该 程序 的 硬件 是 
一 个 低位 优先 〈little-endian) 的 机 器 。 同 样 道理 ， 如 果 在 long 型 的 foo 中 存储 
了 值 37， 而 short 型 的 foo 的 值 却 是 0， 我 们 所 用 的 硬件 可 能 是 一 个 高 位 优先 
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(big-endian) 的 机 器 。 


译注 ， Endian 的 意思 是 “数据 在 内 存 中 的 字 节 排 列 顺序 ”， 表 示 一 个 字 在 内 存 
中 或 传送 过 程 中 的 字 节 顺序 .在 微 处 理 器 中 , 像 iong/DWORD(32 bits) 0x12345678 这 
样 的 数据 总 是 按照 高 位 优先 (BIG ENDIAN) 方 式 存放 的 。 但 在 内 存 中 ,数据 存放 顺序 
则 因 微 处 理 器 厂商 的 不 同 而 不 同 。 一 种 顺序 称 为 big-endian， 即 把 最 高 位 字 节 放 在 最 
前 面 ， 另 一 种 顺序 就 称 为 little-endian， 即 把 最 低位 字 节 放 在 最 前 面 。 


BIG ENDIAN : 最 低地 址 存放 高 位 字 节 ， 可 称 为 高 位 优先 。 内存 从 最 低地 址 开 
始 ， 按 顺序 存放 。BIG ENDIAN 存放 方式 正 是 我 们 的 书写 方式 , 高 数位 数字 先 写 ( 比 
如 ， 总 是 按照 千 、 百 、 十 、 个 位 来 书写 数字 ), 而且 所 有 的 处 理 器 都 是 按照 这 个 顺序 
存放 数据 的 。 


LITTLE ENDIAN : 最 低地 址 存放 低位 字 节 ， 可 称 为 低位 优先 . 内 存 从 最 低地 址 
开始 , 顺序 存放 。 LITTLE ENDIAN 处 理 器 是 通过 硬件 将 内 存 中 的 LITTLE ENDIAN 
排列 顺序 转换 到 寄存 器 的 BIG ENDIAN 排列 顺序 的 , 没有 数据 加 载 /存储 的 开销 , 不 
用 担心 。 





















练习 4-2。 本 章 第 4 节 中 讨论 的 错误 程序 ， 经 过 适当 简化 后 如 下 所 示 : 


#include <stdio.h> 
main() { 
printf{("%g\n", sqrt(2)); 
} 
在 某 些 系统 中 ， 打 印 出 的 结果 是 : 


%g 

为 什么 ? 

在 某 些 C 语言 实现 中 ， 存 在 着 两 种 不 同 版 本 的 printf 函数 :其 中 一 种 实现 了 
用 于 表示 浮 点 格式 的 项 ， 如 %e、%f、%g 等 ; 而 另 一 种 却 没有 实现 这 些 浮 点 格式 。 
库 文 件 中 同时 提供 了 printf 函数 的 两 种 版 本 ， 这 样 的 话 ， 那 些 没有 用 到 浮 点 运算 
的 程序 ， 就 可 以 使 用 不 提供 浮 点 格式 支持 的 版 本 ， 从 而 节省 程序 空间 、 减 少 程序 
大 小 。 

在 某 些 系统 上 ， 编 程 者 必须 显 式 地 通知 连接 器 是 否 用 到 了 浮 点 运算 。 而 为 一 
些 系统 ， 则 是 通过 编译 器 来 告知 连接 器 在 程序 中 是 否 出 现 了 浮 点 运算 ， 以 自动 地 
作出 决定 。 
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上 面 的 程序 没有 进行 任何 浮 点 运算 ! 它 既 没有 包含 math.h 头 文 件 ， 也 没有 声 
明 sqrt 函数 ， 内 此 编译 器 无 从 得 知 sqrt 是 一 个 浮 点 通 数 。 这 个 程序 甚至 都 没有 传 
送 一 个 浮 点 参数 给 sqrt 函数 。 所 以 ， 编 译 器 “ 自 认 合理 ”地 通知 连接 器 ， 该 程序 
没有 进行 浮 点 运算 。 

那 sqrt 函数 又 怎么 解释 呢 ? 难道 sqrt 函数 是 从 库 文件 中 取出 的 这 个 事实 ， 还 
不 足以 证 明 该 程序 用 到 了 浮 点 运算 ? 当然 ，sqrt 函数 是 从 库 文 件 中 取出 的 这 一 点 
没 错 ; 但 是 ， 连 接 器 可 能 在 从 库 文件 中 取出 sqrt 函数 之 前 ， 就 已 经 作出 了 使 用 何 
种 版 本 的 printf 函数 的 决定 。 

练习 5-1。 当 一 个 程序 异常 终止 时 ， 程 序 输出 的 最 后 几 行 常常 会 丢失 ， 原 因 
是 什么 ? 我 们 能 够 采取 怎样 的 措施 来 解决 这 个 问题 ? 

一 个 异常 终止 的 程序 可 能 没有 机 会 来 清空 其 输出 缓冲 区 。 因 此 ， 该 程序 生成 
的 输出 可 能 位 于 内 存 的 某 个 位 置 ， 但 却 永远 不 会 被 写 出 了 。 在 某 些 系统 上 ， 这 些 
无 法 被 写 出 的 输出 数据 可 能 长 达 好 几 页 。 

对 于 试图 调试 这 类 程序 的 编程 者 来 说 ,这 种 丢失 输出 的 情况 经 常会 误导 他 们 ， 
因为 它 会 造成 这 样 一 种 印象 ， 程 序 发 生 失 败 的 时 刻 比 实际 上 运行 失败 的 真正 时 刻 
要 早 得 多 。 解 决 方案 就 是 在 调试 时 强制 不 允许 对 输出 进行 缓冲 。 要 做 到 这 一 点 ， 
不 同 的 系统 有 不 同 的 做 法 ， 这 些 做 法 虽然 存在 细微 差别 ， 但 大 致 如 下 ; 

setbuf{stdout, (char *)0); 

这 个 语句 必须 在 任何 输出 被 写 入 到 stdout (包括 任何 对 printf 函数 的 调用 ) 之 
前 执行 。 该 语句 最 恰当 的 位 置 就 是 作为 main 函数 的 第 一 个 语句 。 

练习 5-2. 下 面 程序 的 作用 是 把 它 的 输入 复制 到 输出 ; 


#include <stdio.h> 
main() { 
register int c; 
while ({c = getchar{)}) != EOF) 


putchar (c}); 


从 这 个 程序 中 移 除 #include 语句 ， 将 导致 程序 不 能 通过 编译 ， 因 为 这 时 EOF 
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是 未 定义 的 。 假 定 我 们 手工 定义 了 EOF (当然 ， 这 是 一 种 不 好 的 做 法 ): 
#define EOF -1 
main() { 
register int c; 
while (l(c = Getchar()) != EOF) 
putchar (c),; 


} 


这 个 程序 在 许多 系统 中 仍然 能 够 运行 ， 但 是 在 某 些 系统 运行 起 来 却 慢 得 多 。 
这 是 为 什么 ? 

函数 调用 需要 花费 较 长 的 程序 执行 时 间 ， 因 此 getchar 经 常 被 实现 为 宏 。 这 个 
宏 在 stdio.h 头 文件 中 定义 ， 因 此 如 果 一 个 程序 没有 包含 stdio.h 头 文件 , 编译 器 对 
getchar 的 定义 就 一 无 所 知 。 在 这 种 情况 下， 编译 器 会 假定 getchar 是 一 个 返回 类 

实际 上 ， 很 多 C 语言 实现 在 库 文件 中 都 包括 有 getchar 函数 ， 原 因 部 分 是 预 
防 编程 者 粗心 大 意 ， 部 分 是 为 了 方便 那些 需要 得 到 getchar 地 址 的 编程 者 。 因 此 ， 
程序 中 忘记 包含 stdio.h 头 文件 的 效果 就 是 ， 在 所 有 getchar 宏 出 现 的 地 方 ， 都 用 
getchar 函数 调用 来 替换 getchar 宏 。 这 个 程序 之 所 以 运行 变 慢 ， 就 是 因为 函数 调 
用 所 导致 的 开销 增多 。 同 样 的 依据 也 完全 适用 于 putchar。 

练习 6-1. 请 使 用 宏 来 实现 max 的 一 个 版 本 ， 其 中 max 的 参数 都 是 整数 ， 要 
求 在 宏 max 的 定义 中 这 些 整 型 参数 只 被 求 值 一 次 。 

max 宏 的 每 个 参数 的 值 都 有 可 能 使 用 两 次 ;一 次 是 在 两 个 参数 作 比 较 时 ; 一 
次 是 在 把 它 作为 结果 返回 时 。 因 此 ， 我 们 有 必要 把 每 个 参数 存储 在 一 个 临时 变量 
中 。 

遗憾 的 是 , 我 们 没有 直接 的 办 法 可 以 在 一 个 C 表达 式 的 内 部 声明 一 个 临时 
变量 。 因 此 ， 如 果 我 们 要 在 一 个 表达 式 中 使 用 max 宏 ， 那 么 我 们 就 必须 在 其 他 
地 方 声明 这 些 临 时 变量 ， 比 如 说 可 以 在 宏 定 义 之 后 ， 但 不 是 将 这 些 变量 作为 宏 
定义 的 一 部 分 进行 声明 。 如 果 max 宏 用 于 不 止 一 个 程序 文件 , 我 们 应 该 把 这 些 
临时 变量 声明 为 static， 以 避免 命名 冲突 。 不 妨 假定 ， 这 些 定义 将 出 现在 某 个 
头 文件 中 : 
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static int max.templ, max_temp2; 
#define max(p, 9q) (max_templ=(p) ,max_ temp2=(gq}), \ 
max._templ>max_temp2? max_templ :max temp2) 

只 要 对 max 宏 不 是 符 套 调用 ， 上 面 的 定义 都 能 正常 工作 ; 在 max 宏 括 套 调 用 
的 情况 下 ， 我 们 不 可 能 做 到 让 它 正常 工作 。 

练习 6-2. 本 章 第 1 节 中 提 到 的 “表达 式 ” 

(x) ((x)-1) 
能 否 成 为 一 个 合法 的 C 表达 式 ? 

一 种 可 能 是 ， 如 果 x 是 类 型 名 ， 例 如 x 被 这 样 定义 : 

typedef int x; 

在 这 种 情况 下 ， 

(Xx) {(x)-1) 
等 价 于 

(int) ((int)-1) 
这 个 式 子 的 含义 是 把 常数 -1 转换 为 int 一 类 型 两 次 。 我 们 也 可 以 通过 预 处 理 指令 
来 定义 x 为 一 种 类 型 ， 以 达到 同样 的 效果 : 

#define x int 

另 一 种 可 能 是 当 x 为 函数 指针 时 。 回 忆 一 下 ， 如 果 某 个 上 下 文中 本 应 需要 也 
数 而 实际 上 却 用 了 函数 指针 ， 那 么 该 指针 所 指向 的 函数 将 会 自动 地 被 取得 并 蔡 换 
这 个 函数 指针 。 因 此 ， 本 题 中 的 表达 式 可 以 被 解释 为 调用 x 所 指向 的 函数 ， 这 个 
函数 的 参数 是 (x)-1。 为 了 保证 (x)-1 是 一 个 合法 的 表达 式 ，x 必须 实际 地 指向 一 个 
函数 指针 数组 中 的 某 个 元 素 。 

x 的 完整 类 型 是 什么 呢 ? 为 了 讨论 问题 方便 起 见 ， 我 们 假定 x 的 类 型 是 T， 
因此 可 以 如 下 声明 x: 

TT 

显而易见 ，x 必须 是 一 个 指针 ， 所 指向 的 函数 的 参数 类 型 是 T。 这 一 点 让 T 
比较 难以 定义 。 下 面 是 最 容易 想到 的 办 法 ， 但 却 没有 用 ， 

typedef voidQ (*T) (T}; 
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因为 只 有 当 了 T 已 经 被 声明 之 后 ， 才 能 这 样 定义 T! 不 过 ，x 所 指向 的 函数 的 参数 
类 型 并 不 一 定 要 是 T， 而 可 以 是 任何 T 可 以 被 转换 成 的 类 型 。 具 体 来 说 ，void * 
类 型 就 完全 可 以 : 

typedef void (*T) (void *); 

这 个 练习 的 用 意 在 于 说 明 ， 对 于 那些 看 上 去 无 从 着 手 、 形 式 “ 怪 异 ” 的 结构 ， 
我 们 不 应 该 轻率 地 一 律 将 其 作为 错误 来 处 理 。 


练习 7-1. 本 章 第 3 节 中 说 ， 如 果 一 个 机 器 的 字符 长 度 为 8 位 ， 那 么 其 整数 
长 度 很 可 能 是 16 位 或 32 位 。 请 问 原 因 是 什么 ? 

某 些 计算 机 为 每 个 字符 分 配 一 个 惟一 的 内 存 地 址 ， 而 另 一 些 机 器 却 是 按 字 来 
对 内 存 寻 址 。 按 字 寻 址 的 机 器 通常 都 存在 不 能 有 效 处 理 字符 数据 的 问题 ， 因 为 要 
从 内 存 中 取得 一 个 字符 ， 就 必须 读 取 整个 字 的 内 容 ， 然 后 把 不 需要 用 到 的 部 分 都 
丢弃 。 


由 于 按 字 符 寻 址 的 机 型 在 字符 处 理 方面 的 效率 优势 ， 它 们 相对 于 按 字 寻 址 的 
机 型 ， 近 年 来 要 更 为 流行 。 然 而 ， 即 使 对 于 按 字 符 寻 址 的 机 器 ， 字 的 概念 在 进行 
整数 运算 的 时 候 也 仍然 是 重要 的 。 因 为 字符 在 内 存 中 的 存储 位 置 是 连续 的 ， 所 以 
一 个 字 中 包含 的 字符 数 ， 将 决定 在 内 存 中 连续 存放 的 字 的 地 址 。 

如 果 一 个 字 中 包含 的 字符 数 是 2 的 某 次 寡 ， 因 为 乘 以 2 的 某 次 寡 的 运算 可 以 
转换 为 移 位 运算 ,所 以 计算 机 硬件 就 能 很 容易 地 完成 从 字符 地 址 到 字 地 址 的 转换 。 
因此 ， 我 们 可 以 合理 地 预期 ， 字 的 长 度 是 字符 长 度 的 2 的 某 次 守 。 


那么 整数 的 长 度 为 什么 不 是 64 位 昵 ? 当然 ， 某 些 时 候 这 样 做 无 疑 是 有 用 的 。 
但 是 ， 对 于 那些 支持 浮 点 运算 的 硬件 的 机 器 ， 这 样 做 的 意义 就 不 大 了 ; 而 且 考 虑 
到 我 们 并 不 经 常 需要 用 到 64 位 整数 这 样 的 精度 ， 实 现 64 位 整数 的 代价 就 过 于 昂 
贵 。 如 果 只 是 偶尔 用 到 ， 我 们 完全 可 以 用 软件 来 仿真 64 位 〈 或 者 更 长 》 的 整数 ， 
而 有 丝毫 不 影响 效率 。 

练习 7-2。 函数 atol 的 作用 是 ， 接 受 一 个 指向 以 null 结尾 的 字符 串 的 指针 作 
为 参数 ， 返 回 一 个 对 应 的 long 型 整数 值 。 假 定 : 

。 作为 输入 参数 的 指针 ， 指 向 的 字符 串 总 是 代表 一 个 合法 的 long 型 整数 值 ， 
因此 atol 函数 无 须 检 查 该 输入 是 否 越界 。 


142 


第 8 章 ”建议 与 答案 


。 人 惟一 合法 的 输入 字符 是 数字 和 正 负 号 。 输入 字符 串 在 遇 到 第 一 个 非法 字符 


请 写 出 atol 函数 的 一 个 可 移植 版 本 。 


我 们 不 妨 假定 在 机 器 的 排序 序列 中 ， 数 字 是 连续 排列 的 ;任何 一 种 现代 计算 
机 都 是 这 样 实现 的 ， 而 且 ANSI C 标准 中 也 是 这 样 要 求 的 。 因 此 ， 我 们 面临 的 主 
要 问题 就 是 避免 中 间 结 果 发 生 溢出 ， 即 使 最 终 的 结果 在 取 值 范围 之 内 也 是 如 此 。 


正如 printnum 函数 中 的 情形 , 如 果 long 型 负数 的 最 小 可 能 取 值 与 正 数 的 最 大 
可 能 取 值 并 不 相 匹配 ， 问 题 就 变 得 坏 手 了 。 特 别 地 ， 如 果 我 们 首先 把 一 个 值 作为 
正 数 处 理 ， 然 后 再 使 它 为 负 ， 对 于 负数 的 最 大 可 能 取 值 的 情况 ， 在 很 多 机 器 上 都 
会 发 生 溢出 。 
下 面 这 个 版 本 的 atol 函数 ， 只 使 用 负数 〈 和 零 》 来 得 到 函数 的 结果 ， 从 而 避 
免 了 溢出 ; 
long atol (char *s) ( 
long r = 0; 
int neg = 0; 


switch(*s) { 


Case 一: 

neg = 1; 

/* 此 处 没有 break 语句 */ 
CaSe '+': 

S++} 

break; 


} 
while (*s >= '0' && *s <= '9') 人 
int n = *s++ - '0'; 
if (neg) 
n = -n; 
bi i 
} 


return rr; 
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与 STDARG 


本 附录 说 明了 C 语言 中 经 常 被 误解 的 3 个 常见 工具 : printf 库 消 数 族 、varargs 
和 stdarg 工具 。 后 两 者 主要 用 于 编写 那些 随 调用 场合 的 不 同 ， 其 参数 的 数 日 和 类 
型 也 不 同 的 函数 。 笔 者 经 常见 到 某 些 程序 还 在 使 用 printf 函数 中 多 年 前 就 已 基本 
废弃 不 用 的 特性 ， 也 见 到 另 一 些 程序 ,明明 要 完成 的 任务 利用 varargs 和 stdarg 可 
以 做 得 干净 利落 、 漂 漂亮 亮 ， 但 它们 却 使 用 了 各 种 千奇百怪 的 杂凑 招式 ， 而 且 这 
些 天 知道 怎么 想 出 来 的 办 法 并 不 具有 一 般 性 ， 因 而 难于 移植 。 


A.1 printf 函数 族 


下 面 的 程序 与 我 们 在 第 0 章 中 给 出 的 第 1 个 C 程序 非常 类 似 ; 


#include <stdio.h> 
main{) { 

printf{"Hello world\n"),; 
} 


这 个 程序 的 输出 是 : 


Hello world 


后 面 跟 一 个 换行 符 (\n)。 


printf 函数 的 第 1 个 参数 是 关于 输出 格式 的 说 明 , 它 是 一 个 描述 了 输出 格式 的 
字符 捉 。 这 个 字符 串 遵循 通常 的 C 语言 惯例 ， 以 空 字符 〈 即 \0) 结尾 。 我 们 把 这 
个 字符 串 写 成 字符 串 常 量 的 形式 ( 即 用 双 引 号 括 起 来 )， 就 能 够 自动 保证 它 以 空 字 

printf 函数 把 格式 说 明 字符 串 中 的 字符 逐一 复制 到 标准 输出 , 直到 格式 字符 串 
结束 或 者 遇 到 一 个 % 字 符 。 这 时 ，printf 函数 并 不 打印 出 % 字 符 ， 而 是 查看 紧 跟 % 
字符 之 后 的 若干 字符 ， 以 获得 有 关 如 何 转换 其 下 一 个 参数 的 指示 。 转 换 后 的 参数 
将 替换 % 字 符 以 及 其 后 若干 字符 的 位 置 ， 由 printf 函数 打印 到 标准 输出 。 因 为 上 
例 中 printf 函数 的 格式 字符 串 并 没有 包含 % 字 符 ， 因 此 所 输出 的 就 是 格式 字符 串 
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本 身 。 格 式 字符 串 ， 以 及 与 之 对 应 的 参数 ， 决 定 了 输出 中 的 每 个 字符 《〈 也 包括 作 
为 每 行 结束 标志 的 换行 符 )。 

与 printf 函数 同族 的 还 有 两 个 函数 ，fprintf 和 sprintf。printf 函数 是 把 数据 写 
到 标准 输出 , 而 fprintf 函数 则 可 以 把 数据 写 到 任何 文件 中 。 需要 写 入 的 特定 文件 ， 
将 作为 fprintf 函数 的 第 1 个 参数 ， 它 必须 是 一 个 文件 指针 。 因 此 ， 

printf (stuff); 

从 意义 上 来 说 就 等 效 于 

fprintf(stdout, stuff); 

当 输 出 数据 不 是 被 写 入 一 个 文件 时 ， 我 们 可 以 使 用 sprintf 函数 。sprintf 户 数 
的 第 1 个 参数 是 一 个 指向 字符 数组 的 指针 ，sprintf 函数 将 把 其 输出 数据 写 到 这 个 
字符 数组 中 。 编程 人 员 应 该 确保 这 个 数组 足够 大 以 容纳 sprintf 函数 所 生成 的 输出 
数据 。sprintf 函数 其 余 的 参数 与 printf 函数 的 参数 相同 。sprintf 函数 生成 的 输出 数 
据 总 是 以 空 字符 收尾 ， 如 果 希 望 在 输出 数据 中 出 现 一 个 空 字符 ， 我 们 可 以 显 式 地 
使 用 %c 格式 说 明 把 它 打印 出 来 。 

这 三 个 函数 的 返回 值 都 是 已 传送 的 字符 数 。 对 于 sprintf 的 情形 ， 作 为 输出 数 
据 结束 标志 的 空 字 符 并 不 计 入 总 的 字符 数 。 如 果 printf 或 fprintf 在 试图 号 入 时 出 
现 一 个 VO 错误 ， 将 返回 一 个 负 值 。 在 这 种 情况 下 ， 我 们 就 无 从 得 知 究竟 有 多 少 
字符 已 经 被 写 出 。 因 为 sprintf 函数 并 不 进行 WO 操作 ， 因 此 它 不 会 返回 负 值 。 当 
然 ， 也 不 排除 有 的 C 语言 实现 会 因为 某 种 原因 ， 而 令 sprintf 函数 返回 一 个 负 值 。 

因为 格式 字符 串 决定 了 其 余 参数 的 类 型 ， 而 且 可 以 到 运行 时 才 建 立 格式 字符 
串 ， 所 以 C 语言 实现 要 检查 printf 函数 的 参数 类 型 是 否 正确 是 异常 困难 的 。 如 果 
我 们 像 下 面 这 样 写 : 

printf("%G\n", 0.1); 

或 者 

printf("%g\n", 2); 

最 后 得 到 的 结果 可 能 毫 无 意义 ， 而 且 在 程序 实际 运行 之 前 ， 这 些 错 误 极 有 可 能 不 
会 被 编译 器 检测 到 ， 而 成 为 “漏网 之 色 ”。 
大 多 数 C 语言 实现 都 无 法 检测 出 下 面 的 错误 : 


fprintf ("error\n"};} 
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上 例 中 ， 程 序 员 的 本 意 是 使 用 fprintf 函数 输出 一 行 出 错 提示 信息 到 stderr， 
但 是 却 一 时 大 意 忘 记 写 stderr; 由 于 fprintf 函数 会 把 格式 字符 串 当 作 一 个 文件 结 
构 来 处 理 ， 这 种 情况 下 就 很 可 能 出 现 内 核 转 储 的 后 果 ! 


简单 格式 类 型 


格式 字符 串 中 的 每 个 格式 项 都 由 一 个 % 符 号 打头 ， 后 面 接 一 个 称 为 格式 码 的 
字符 ， 格 式 码 指明 了 格式 转换 的 类 型 。 格 式 码 不 一 定 要 紧 跟 在 % 符 号 之 后 ， 它 们 
中 间 可 能 夹 一 些 可 选 的 字符 ， 这 些 可 选 字符 以 各 种 方式 修改 转换 ， 我 们 将 在 后 面 
详细 讨论 这 些 方式 。 每 个 格式 项 都 是 以 格式 码 结束 。 

最 常用 的 格式 项 肯定 是 %d， 这 个 格式 项 的 含义 是 以 10 进 制 形式 打印 一 个 整 
数 。 例 如 ， 

printf("2 + 2 = %d\n", 2 + 2) 

将 打印 出 : 

2+2=4 
后 面 跟 一 个 换行 符 ( 下 面 的 例子 对 输出 中 换行 符 的 出 现 将 不 再 袭 述 )。 

%d 格式 项 请 求 打印 一 个 整数 ， 因 此 后 面 必须 有 一 个 相应 的 整 型 参数 。 当 格 
式 字 符 串 被 复制 到 输出 文件 时 ， 其 中 的 9%d 格式 项 将 被 对 应 的 待 输出 整数 的 10 进 
制 值 替换 ， 蔡 换 时 不 会 在 整数 值 的 前 后 添加 空格 字符 。 如 果 该 整数 是 负 值 ， 输 出 
值 的 第 一 个 字符 就 是 ,- ' 符 号。 

%u 格式 项 与 %d 格式 项 类 似 ， 只 不 过 要 求 打印 无 符号 10 进 制 整数 。 因 此 ， 
下 例 中 : 

printf{({"%u\n", -37); 

将 打印 出 : 

4294967259 
前 提 是 所 在 机 型 上 整数 是 32 位 。 

回忆 一 下 , 我 们 在 前 面 章 节 中 提 到 过 , char 型 和 short 型 的 参数 会 被 自动 扩展 
为 int 型 。 在 把 char 类 型 的 值 视 为 有 符号 整数 的 机 型 上 ， 这 一 -点 经 常会 引起 令 人 
吃惊 的 后 果 。 例 如 ， 在 这 样 的 机 型 上 ， 
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char c; 

C = -37;} 

printf("%u\n", Cc); 
将 打印 出 : 

4294967259 
因为 此 时 字符 型 的 -37 被 转换 成 了 整 型 的 -37。 要 避免 这 一 问题 ， 我 们 应 该 把 %u 
格式 项 仅 用 于 无 符号 整数 。 

%o、%x 和 %X 格式 项 用 于 打印 8 进 制 或 16 进 制 的 整数 。%o 格式 项 请 求 输 
出 8 进 制 整数 ， 而 %x 和 %X 则 请 求 输出 16 进 制 整数 。%x 和 %X 格式 项 的 唯一 区 
别 就 是 ，%x 格式 项 中 用 小 写字 母 a、b、c、d、e 和 f 来 表示 10 到 15 的 数位 值 ， 
而 %X 格式 项 中 是 用 大 写字 母 A、B、C、D、E 和 下 来 表示 。8 进 制 和 16 进 制 整 
数 总 是 作为 无 符号 数 处 理 。 


我 们 来 看 一 个 例子 : 


int n = 108,; 
printf("%d decimal = %0 octal = %x hex\n", n, Nn, n); 


将 打印 出 : 

108 decimal = 154 octal = 6c¢ hex 

如 果 上 例 中 用 %X 代替 了 %x， 那 么 输出 将 变 成 

108 decimal = 154 octal = 6C hex 

%s 格式 项 用 于 打印 字符 串 :, 与 之 对 应 的 参数 应 该 是 一 个 字符 指针 , 待 输出 的 
字符 始 于 该 指针 所 指向 的 地 址 ， 直 到 出 现 一 个 空 字符 (0') 才 终 止 。 下 面 是 %s 
格式 项 的 一 种 可 能 用 法 : 


printf ("There %s %d itemgss in the list.\n", 
n!=1? "are": "is", n, n!=1l? "s": ""); 


上 例 的 第 1 个 %s 格式 项 ， 将 被 is 或 者 are 替换 ， 第 2 个 %s 格式 项 ， 将 被 s 
或 者 空 字符 串 替换 。 因 此 ， 如 果 n 是 37， 输 出 将 是 : 

There are 37 items in the list. 
但 是 如 果 n 是 1， 输 出 将 是 : 

There is 1 item in the list. 

%s 格式 项 所 对 应 输出 的 字符 串 必须 以 一 个 空 字符 〈\0') 作为 结束 标志 《 唯 
一 的 例外 情况 将 在 后 面 讨论 )。 因 为 printf 函数 要 以 此 来 定位 一 个 字符 串 何 时 结束 ， 
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会 此 别 无 他 法 。 如 果 与 %s 对 应 的 笠 符 串 并 不 是 以 空 学 符 《〈\0') 作为 结束 标志 ， 
那么 printf 函数 将 不 断 打 印 出 其 后 的 学 符 ， 直 到 在 内 存 中 某 处 找到 一 个 空 字符 
(0')。 这 种 情况 下 ， 最 终 的 输出 可 能 相当 地 长 ! 

因为 %s 格式 项 将 打印 出 对 应 参数 中 的 每 个 字符 ， 所 以 

printf(s); 
与 

printf("%s", s); 
两 者 的 含义 并 不 相同 。 第 1 个 例子 将 把 字符 串 s 中 的 任何 % 字 符 视 为 一 个 格式 项 
的 标志 ， 因 而 其 后 的 字符 会 被 视 为 格式 码 。 如 果 除 %% 之 外 的 任何 格式 码 在 字符 
串 s 中 出 现 ， 而 后 面 又 没有 对 应 的 参数 ， 将 会 带 来 麻烦 。 而 第 2 个 例子 ， 将 会 打 
印 出 任何 以 空 字符 结尾 的 字符 串 。 

因为 一 个 NULL 指针 并 不 指向 任何 实际 的 内 存 位 置 ， 它 肯定 也 不 可 能 指向 一 
个 字符 串 。 内 此 ， 

printtf"gssNn"，NULD) ， 


的 结果 将 难以 预料 。 本 书 3.5 节 对 这 种 情况 作 了 详细 讨论 。 


%c 格式 项 用 于 打印 单个 字符 : 
Brintf ("SG", “CG); 
就 等 效 于 


putchar {c}); 
但 是 前 者 的 适应 性 和 灵活 性 更 好 ， 能 够 把 字符 c 的 值 失 入 某 个 更 大 的 上 下 文中 。 
与 %c 格式 项 对 应 的 参数 是 一 个 为 了 打印 输出 而 被 转换 为 字符 型 的 整 型 值 。 例 如 : 


printf("The decimal equivalent of '%c’' is %$d\n", 


tw Tw) 
了 


将 打印 出 : 

The decimal equivalent of '*! is 42 

%g、%f 和 9be 这 3 个 格式 项 用 于 打印 浮 点 值 。9%g 格式 项 用 于 打印 那些 不 需 
要 按 列 对 齐 的 浮 点 数 特别 有 用 。 它 在 打印 出 对 应 的 数值 必须 为 浮 点 型 或 双 精 度 
类 型 时 ， 会 去 掉 该 数值 尾 级 的 零 ， 保 留 六 位 有 效 数字 。 因 此 ， 在 我 们 包含 了 
math.h 头 文件 之 后 ， 
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printfi"Pi = %g\n", 4 * atan(1.0)):; 
将 打印 出 : 

Pi = 3.14159 
而 

printf("%g %g 8%g $9g ggGNn 

TFT 0; LT/2 0 TA3 0 LAD OO 

将 打印 出 : 

1 0.5 0.333333 0.25 0 

注意 ， 因 为 一 个 数 中 出 现在 前 面 的 零 对 于 数值 精度 没有 贡献 ， 所 以 在 
0.333333 中 会 有 6 个 3。 输出 的 数值 被 四 舍 五 入 ， 而 不 是 直接 截断 : 

printf("%g\n", 2.0 / 3.0); 
将 打印 出 : 

0.666667 

如 果 一 个 数 的 绝对 值 大 于 999999， 按 %g 的 格式 打印 出 这 个 数 就 会 面临 一 个 
两 难 选 择 ， 要么 需要 打印 出 超过 6 位 的 有 效 数字 ， 要 么 打印 出 的 是 一 个 不 正确 的 
值 。%g 格式 项 解决 这 个 难题 的 方式 是 ， 采 用 科学 计数 法 来 打印 这 样 的 数值 : 

Printf("ggNn"，123456789.0): 
将 打印 出 : 

1.23457e+08 
我 们 看 到 ， 这 个 数 在 用 科学 计数 法 来 表示 时 ， 被 四 舍 五 入 到 6 位 有 效 数字 。 

当 一 个 数 的 绝对 值 很 小 时 ， 要 表示 这 个 数 所 需要 的 字符 数目 就 会 多 到 让 人 难 
于 接受 。 举 例 而 言 ， 如 果 我 们 把 zxX 102 写作 0.000000000314159 就 显得 非常 丑 
陋 不 雅 ， 反 之 ， 如 果 我 们 写作 3.14159e-10， 就 不 但 简洁 而 且 易 读 好 懂 。 当 指数 是 
-4 时 ， 这 两 种 表现 形式 的 长 度 就 恰好 相等 。 例 如 ，0.000314159 与 3.14159e-04 所 
-占用 的 空间 大 小 相同 。 对 于 比较 小 的 数值 ， 除 非 该 数 的 指数 小 于 或 等 于 -5，%8 
格式 项 才 会 采用 科学 计数 法 来 表示 。 因 此 ， 

printf{("%g %g %g\n", 3.14159e-3, 3.14159e-4, 3.14159e-5); 
将 打印 出 : 


0.00314159 0.000314159 3.14159e-05 
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%e 格式 项 用 于 打印 浮 点 数 时 ， 要 求 一 律 显 式 地 使 用 指数 形式 : r 在 使 用 %e 
格式 项 时 将 被 写成 3.141593e+00。%e 格式 项 将 打印 出 小 数 点 后 6 位 有 效 数字 ， 
而 并 非 如 %g 格式 项 打印 出 的 数 是 总 共 6 位 有 效 数字 。 

%f 格式 项 则 恰好 相反 ,强制 禁 止 使 用 指数 形式 来 表示 浮 点 数 ， 因 此 就 被 写 
成 3.141593。 在 数值 精度 方面 ，%f 格式 项 的 要 求 与 %e 格式 项 相同 ， 即 小 数 点 后 
6 位 有 效 数 字 。 内 此 ， 一 个 非常 小 的 数值 即使 不 是 0, 看 上 去 也 会 与 0 差不多; 而 
一 个 很 人 的 数值 ， 看 上 去 就 会 是 一 大 堆 数 字 : 

printf("%f\n", 1e38); 

将 打印 出 : 

100000000000000000000000000000000000000，000000 

这 个 例子 中 打印 出 的 数值 的 数字 位 数 ， 超 过 了 大 多 数 硬 件 能 够 表示 的 精度 范 
围 ， 因 此 对 于 不 同 的 机 型 最 终 的 结果 也 随 之 不 同 。 

WE 和 %G 格式 项 与 它们 对 应 的 %e 和 %g 格式 项 在 行为 方式 上 基本 相同 ， 除 
了 用 大 写 的 了 E 代替 了 小 写 的 e 来 表示 指数 形式 。 

狗 儿 格式 项 用 于 打印 出 一 个 多 字 符 。 这 个 格式 项 的 独特 之 处 在 于 它 不 需要 一 
个 对 应 的 参数 。 因 此 ， 下 面 的 语句 

printf("%%d prints a decimal value\n'"); 

将 打印 出 : 


g%q prints a decimal value 


修饰 符 


printf 函数 也 接受 辅助 字符 来 修饰 一 个 格式 项 的 含义 。 这 些 辅 助 字符 出 现在 % 
符号 和 后 面 的 格式 码 之 间 。 

整数 有 3 种 不 同类 型 ， 对 应 3 种 不 同 长 度 : short，long 和 正常 长 度 。 如 果 一 
个 short 整数 作为 任何 一 个 函数 〈 也 包括 printf 函数 ) 的 参数 出 现 ， 它 会 被 自动 地 
扩展 为 一 个 正常 长 度 的 整数 。 但 是 ， 我 们 仍然 需要 一 种 方式 ， 来 通知 printf 函数 
某 个 参数 是 long 型 整数 。 我 们 可 以 在 格式 码 之 前 紧 挨 着 插入 一 个 长 度 修饰 符 1， 
创造 出 %ld、%lo、%ilx 和 %lu 作为 新 的 格式 码 。 这 些 前 面 加 了 修饰 符 的 格式 码 与 
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不 加 修饰 符 的 格式 码 在 行为 方式 上 完全 相同 , 只 是 它们 要 求 long 型 整数 作为 其 对 
应 参数 。 即 使 在 小 部 分 不 直接 支持 long unsigned 类 型 数值 的 C 语言 实现 上 ，%lu 
格式 项 仍然 会 把 long 型 整数 当 作 long 型 无 符号 整数 打印 出 来 。! 修饰 符 只 对 用 于 
整数 的 格式 码 有 意义 。 

许多 C 语言 实现 以 同样 的 精度 存储 int 型 和 long 型 的 数值 。 在 这 种 机 型 上 ， 
如 果 忘 记 使 用 1 修饰 符 将 不 会 被 检测 到 ; 只 有 当 程 序 被 移植 到 另 一 种 int 型 和 long 
型 有 真正 区 别 的 机 型 上 时 ， 错 误 才 会 暴露 出 来 。 因 此 ， 例 如 ; 


long size; 





printf ("gd\n", size); 
在 某 些 机 型 上 能 够 工作 ， 而 在 另 一 些 机 型 上 却 无 法 工作 。 

利用 宽度 修饰 符 ， 我 们 可 以 轻松 做 到 在 固定 长 度 的 域内 打印 数值 。 宽 度 修饰 
符 出 现在 % 符 号 和 格式 码 的 中 间 ， 其 作用 是 指定 它 所 修饰 的 格式 项 所 应 打印 的 字 
符 数 。 如 果 待 打印 的 数值 不 能 填 满 位 置 ， 它 的 左 侧 就 会 被 补 上 空格 字符 以 使 这 个 
数值 的 宽度 满足 要 求 。 如 果 待 打印 的 数值 太 大 而 超过 了 给 定 的 域 宽 ， 输 出 域 就 会 
适当 地 调整 以 容纳 该 数值 。 宽 度 修 饰 符 绝对 不 会 截断 一 个 输出 域 。 当 我 们 使 用 宽 
度 修饰 符 来 按 列 对 齐 一 组 数字 时 , 如 果 一 个 数值 太 大 而 不 能 被 它 所 在 的 栏 所 容纳 ， 
那么 它 就 会 挤占 同一 行 右 侧 紧邻 数值 的 位 置 。 

下 面 这 段 代码 : 


int 工 ; 
for (i = 0; i <= 10; i++) 
printf("%2d %2d *\n", i , i*i); 


将 生成 以 下 输出 ; 


hm 必 hb 靖 呈 
睛 

On Oo 

A 


[SS] 
un 
于 和 于 


VD 
oo 
情 


10 100 * 


上 例 中 的 *， 作 用 是 标志 一 行 的 结束 。 数 值 100 需要 3 个 字符 才能 完整 显示 ， 
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而 宽度 修饰 符 指定 的 却 是 2 个 字符 的 域 宽 ， 因 此 它 所 在 的 域 将 会 被 自动 扩展 ， 而 
同一 行 后 面 的 部 分 将 依次 右 移 。 
宽度 修饰 符 对 所 有 的 格式 码 都 有 效 ， 甚 至 %% 也 不 例外 。 因 此 ， 例 如 : 
printf("%8%\n"); 
将 在 一 个 宽度 为 8 个 字符 的 域 中 以 右 对 齐 的 方式 打印 出 一 个 % 符 号 。 换 言 之 ， 就 
是 先 打 印 出 7 个 空格 字符 ， 然 后 紧 跟着 打印 一 个 % 符 号 。 


精度 修饰 符 的 作用 是 控制 一 个 数值 的 表示 中 将 要 出 现 的 数字 位 数 ， 或 者 用 于 
限制 将 要 打印 的 字符 串 中 应 该 出 现 的 字符 数 。 精 度 修饰 符 包括 一 个 小 数 点 ， 和 小 
数 点 后 面 的 一 串 数字 。 精 度 修饰 符 出 现在 % 符 号 和 宽度 修饰 符 之 后 ， 格 式 码 与 长 
度 修饰 符 之 前 。 精 度 修 饰 符 的 确切 含义 与 格式 码 有 关 : 


。 对 于 整数 格式 项 9%d、%o、%x 和 %u， 精 度 修 饰 符 指定 了 打印 数字 的 最 少 
位 数 。 如 果 待 打印 的 数值 并 不 需要 这 么 多 位 数 的 数字 来 表示 ， 就 会 在 它 的 前 面 补 
上 0。 因 此， 

printf ("%$.2G/%.2d/%.4d\n", 7, 14, 1789); 
将 打印 出 : 

07/14/1789 

， 对 于 %e、%E 和 %f 格式 项 ， 精 度 修饰 符 指定 了 小 数 点 后 应 该 出 现 的 数字 
位 数 。 除 非 标志 (Flag， 我 们 马上 将 讨论 到 ) 另 有 说 明 ， 仅 当 精 度 大 于 0 时 打印 
的 数值 中 才 会 实际 出 现 小 数 点 。 因 此 ， 当 我 们 包含 了 math.h 头 文件 之 后 : 


double pi; 

pi = 4 * atan(1l.0); 

printf("%.0f %.1f $%.2f $$.3f %.6f %.10f\n", 
Di pi, pi, pi, pi, pi); 

printf("%.0e %.1le $.2e $.10e\n", 
pi, pi, pi, pi, pi, pi); 

将 打印 出 : 
3 3.1 3.14 3.142 3.141593 3.1415926536 
3e+00 3.1e+00 3.14e+00 3.1415926536e+00 


。 对 于 %g 和 %G 格式 项 ， 精 度 修 饰 符 指定 了 打印 数值 中 的 有 效 数 字 位 数 。 
除非 标志 另 有 说 明 ， 非 有 效 数 字 的 0 将 被 去 掉 ， 如 果 小 数 点 后 不 跟 数字 则 小 数 点 
也 将 被 删除 。 


printf("%.1]g 名.2g %,.49g9 %$.8g\n", 
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10/3.0, 10/3.0, 10/3.0, 10/3.0); 
将 生成 以 下 输出 : 
3 3.3 3.333 3.3333333 
。 对 于 %s 格式 项 , 精度 修饰 符 指 定 了 将 要 从 相应 的 字符 串 中 打印 的 学 符 数 。 
如 果 该 字符 串 中 包含 的 字符 数 少 于 精度 修饰 符 所 指定 的 字符 数 ， 输 出 的 字符 数 驶 
会 少 于 精度 修饰 符 指定 的 数目 。 如 果 需 要 , 我 们 可 以 通过 域 宽 修 饰 符 来 加 长 输出 。 


在 某 些 系统 中 ， 文 件 名 组 件 被 存储 于 一 个 包含 有 14 个 字符 元 素 的 数组 中 。 
如 果 组 件 名 少 于 14 个 字符 ， 那 么 数组 的 剩余 部 分 将 被 空 字符 填充 ; 但 是 ,如果 组 
件 名 恰好 为 14 个 字符 ， 数 组 将 被 完全 占用 ， 没 有 一 个 空 字符 来 作为 结束 标志 。 要 
打印 这 样 的 文件 名 ， 应 该 如 下 所 示 : 


char name{[l4]; 


printf("..,. %.14s ...", ..., name, ...}; 


这 样 做 就 保证 了 无 论文 件 名 有 多 长 ， 它 总 能 够 被 正确 地 打印 输出 。 使 用 
%14.14s 格式 项 ， 将 确保 打印 出 14 个 字符 ， 而 不 管 文件 名 的 长 度 究竟 如 何 。( 如 
果 有 必要 , 将 在 文件 名 的 左 侧 填补 空白 字符 以 达到 14 个 字符 ; 至 于 如 何在 右 侧 填 
补 ， 我 们 马上 将 要 讲 到 )。 


。 对 于 9%c 和 9%% 格 式 项 ， 精 度 修饰 符 将 被 忽略 。 
标志 


我 们 可 以 在 % 符 号 和 域 宽 修饰 符 之 间 插 入 标志 字符 ， 以 微调 格式 项 的 效果 。 
标志 字符 以 及 它们 的 含义 如 下 : 

， 在 显示 宽度 大 于 被 显示 位 数 时 ， 数 据 尾 部 都 以 显示 区 的 右 端 对 齐 ， 左 端 
则 被 填充 空白 字符 。 标 志 字 符 -的 作用 是 ， 要 求 显示 方式 改 为 左 端 对 齐 ， 在 右 端 填 
充 空白 字符 。 因 此 ， 仅 当 域 宽 修 饰 符 存 在 时 ， 标 志 字 符 - 才 有 意义 。( 否则 ， 填 充 
空白 字符 就 无 从 说 起 。) 

要 在 固定 栏 内 打印 字符 串 ， 一 般 来 说 ， 左 端 对 齐 的 形式 看 上 去 要 美观 整齐 一 
点 。 因 此 ， 类 似 于 %14s 这 样 的 格式 项 可 能 并 不 正确 ， 而 应 该 写作 %-14s。 前 面 的 
例子 如 果 稍 作 改动 ， 得 到 的 结果 会 更 赏心悦目 一 些 ; 
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char name [14]; 
printf("... %-14s ..,.", ,,.., Name, ...);} 


。 标志 字符 + 的 作用 是 ， 规 定 每 个 待 打 印 的 数值 在 输出 时 都 应 该 以 它 的 符号 
( 正 号 或 负 号 ) 作为 第 一 个 字符 。 因 此 ， 非 负数 打印 出 来 ， 应 该 在 最 前 面 有 一 个 正 


号 。 标 志 字 符 + 与 标志 字符 -之 间 不 存在 任何 联系 。 
printf ("%+d %+d $+d\n", -5, 0, 5); 

将 生成 以 下 输出 : 
-5 +0 +5 


。 室 白 字符 作为 标志 学 符 时 ， 它 的 含义 是 : 如 果 某 数 是 一 个 非 负 数 ， 就 在 
它 的 前 面 插 入 一 个 空白 字符 。 如 果 我 们 希望 让 固定 栏 内 的 数值 向 左 对 齐 ， 而 又 不 
想 用 标志 字符 +， 这 一 点 就 特别 有 用 。 如 果 标 志 字 符 + 与 空白 字符 同时 出 现在 一 个 
格式 项 中 ， 最 终 的 效果 以 标志 字符 + 为 准 。 例 如 ， 
= -3; i <= 3; i++) 
printf("%® d\n", i); 


将 打印 出 : 


如 果 我 们 希望 在 固定 栏 内 按 科 学 计数 法 打印 数值 ， 格 式 项 % e 和 %+e 要 比 正 
常 的 格式 项 %e 有 用 得 多 。 因 为 ， 这 时 出 现在 非 负 数 前 面 的 正 号 (或 者 空白 ) 保 
证 了 所 有 输出 数值 的 小 数 点 都 会 对 齐 。 例 如 : 


double x; 
for (x = -3; X <= 3; X++) 
printf("% e $+e $e\n", XxX, X, X)}; 
将 打印 出 : 
-3.000000e+000 -3.000000e+000 -3.000000e+000 
-2.000000e+000 -2.000000e+000 -2.000000e+000 
-1.000000e+000 -1.000000e+000 -1.000000e+000 


0.000000e+000 +0.000000e+000 0.000000e+000 
1.000000e+000 +1.000000e+000 工 .000000e+000 
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2.000000e+000 +2.000000e+000 2.000000e+000 
3.000000e+000 +3.000000e+000 3.000000e+000 


我 们 注意 到 ， 按 %e 格式 项 打印 出 来 的 最 后 一 列 数值 的 小 数 点 并 没有 正确 地 
对 齐 ， 而 按 另外 两 个 格式 项 打印 出 来 的 前 两 列 数值 的 小 数 点 就 对 齐 了 。 


。 标志 字符 # 的 作用 是 对 数值 输出 的 格式 进行 微调 ， 有 具体 的 方式 与 特定 格式 
项 有 关 。 给 %o 格式 项 加 上 标志 字符 # 的 效果 是 : 当 有 必要 时 增加 数值 输出 的 精度 
《这 只 需 让 输出 的 第 1 个 数字 为 0 就 已 经 做 到 了 )。 这 么 规定 的 意义 在 于 ， 让 八 进 
制 数值 输出 的 格式 与 大 多 数 C 程序 员 惯 用 的 形式 一 致 。s#o 与 0%o 并 不 相同 ， 因 
为 0%o 把 数值 0 打印 成 00， 而 %#o 的 打印 结果 是 0。 同 理 ， 格 式 项 s#x 与 8#X 要 
求 打印 出 来 的 16 进 制 数值 前 面 分 别 加 上 0x 或 0X。 


标志 字符 # 对 浮 点 数 格式 的 影响 有 两 方面 : 其 一 ， 它 要 求 小 数 点 必须 被 打印 
出 来 ， 即 使 小 数 点 后 没有 数字 也 是 如 此 ;其 二 ， 如 果 用 于 sg 或 sG 格式 项 ， 打 印 
出 的 数值 尾 缀 的 0 将 不 会 被 去 掉 。 例 如 : 


printf("%.0f %#,.0f %g %S#g\n", 
3%0 Be0 IO Oy 


将 打印 出 : 


3 3. 3 3.00000 


除了 + 和 空白 字符 ， 其 余 的 标志 字符 都 是 各 自 独立 的 。 


可 变 域 宽 与 精度 


在 部 分 C 程序 中 ， 某 些 字符 数 组 的 长 度 被 有 意 地 定义 为 一 个 显 式 常量 
(manifest constant)。 这 样 ， 如 果 数 组 长 度 有 变动 ， 就 只 需要 改动 一 处 即 可 。 但 是 ， 
在 需要 打印 字符 数组 的 长 度 时 ， 又 只 能 在 程序 中 把 它 写成 整数 常量 。( 译 注 : 这 种 
在 程序 中 写 “ 死 ”的 数字 ， 一 般 称 为 magic number) 由 是 ， 我 们 此 前 提 到 的 那个 
例子 ， 可 能 被 写成 下 面 这 样 : 

#define NAMESIZE 14 


char name [NAMESIZE]; 


dnt 146 on Ty vr Hamey 2a.)3 
这 样 做 实在 是 不 智之 举 。 我 们 定义 NAMESIZE 的 目的 就 是 希望 只 需要 在 一 
处 提 及 14 这 个 数值 。 而 像 这 样 写 ， 当 我 们 改动 NAMESIZE 之 后 ， 还 需要 搜索 每 
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个 printf 函数 调用 的 地 方 找到 要 更 改 的 数值 ， 而 这 恰恰 是 最 容易 遗忘 或 忽视 的 地 
方 。 然 而 ， 我 们 又 不 能 够 在 printf 网 数 调用 中 直接 使 用 NAMESIZE: 
printf("... %.NAMESIZE ...", ... +, Name, Ee 
这 样 写 一 点 用 处 也 没有 ， 内 为 预 处 理 器 的 作用 范围 不 能 达到 字符 串 的 内 部 。 
考虑 到 这 些 ，printf 消 数 因此 允许 间接 指定 域 宽 和 精度 。 要 做 到 这 一 点 ,我 们 
只 需 用 * 痊 换 域 宽 修 饰 符 或 精度 修饰 符 其 中 之 一 ,或 者 两 者 都 替换 ,在 这 种 情况 下 ， 
printf 函数 首先 从 参数 列表 中 取得 将 要 使 用 的 域 宽 或 精度 的 实际 数值 , 然后 使 用 该 
数值 来 完成 打印 任务 。 因 此 ， 上 面 的 例子 可 以 写成 这 样 : 
printf{"..,. %.*Ss ...", ... ,+ NAMESIZE, name, RN 
如 果 我 们 使 用 * 同 时 替换 域 宽 修饰 符 与 精度 修饰 符 ， 那 么 后 面 的 参数 列表 中 
将 依次 出 现代 表 域 宽 的 参数 、 代 表 精 度 的 参数 以 及 代表 要 打印 的 值 的 参数 。 因 此 ， 
printf("%*.*s\n", 12, 5, str); 
与 下 式 完 全 等 效 
printf ("*%12.5s\n", str); 
这 个 式 子 将 打印 出 字符 串 str 的 前 5 个 字符 (或 者 更 少 ， 如 果 strlen(s) < 5)， 前 面 
将 填充 若干 空白 字符 以 达到 总 共 打印 12 个 字符 的 要 求 。 下 面 这 个 例子 鲜 有 人 能 够 
说 明 其 含义 ; 
PILE( "要 * 委 Nm， 刀 ) ; 
上 式 将 在 宽度 为 n 个 字符 的 域内 以 右 端 对 齐 的 方式 打印 出 一 个 % 符 号 ， 换 言 之 ， 
就 是 先 打印 n-1 个 空白 字符 ， 后 面 再 跟 一 个 % 符 号 。 
如 果 * 用 于 替换 域 宽 修 饰 符 ， 而 与 其 对 应 参数 的 值 为 负数 ， 那 么 效果 相当 于 
把 负 号 作为 -标志 字符 来 处 理 。 因 此 ， 上 例 中 如 果 n 为 负数 ,输出 结果 首先 是 一 个 
% 符 号 ， 后 面 再 跟 -n-1 个 空格 。( 译 注 ， 原 书 为 -np， 疑 此 处 有 误 。) 


新 增 的 格式 码 


ANSIC 标准 的 定义 中 新 增 了 两 个 格式 码 : %p 和 %n。%p 用 于 以 某 种 形式 打 
印 一 个 指针 ， 具 体 的 形式 与 特定 的 C 语言 实现 有 关 〔 译 注 : 一 般 是 打印 出 该 指针 
所 指向 的 地 址 )。%n 用 于 指出 已 经 打印 的 字符 数 ， 这 个 数 被 存储 在 对 应 参数 〈 一 
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个 整 型 指针 〉 所 指向 的 整数 中 。 执 行 完 以 下 代码 之 后 ， 


int n; 
printf{"hello\ngn", &n); 


n 的 值 就 是 6。 


废止 的 格式 码 


随 着 时 间 的 推移 ，printf 函数 的 有 些 特性 也 逐渐 消亡 。 但 仍 有 一 些 C 语言 实 
现 ， 对 它们 还 提供 支持 。 

%D 和 %O 格式 项 曾经 与 %1d 和 %lo 的 含义 相同 。 不 仅 于 此 ，%X 格式 项 与 
%Ix 格式 项 也 一 度 有 相同 的 含义 。 后 来 人 们 考虑 到 ， 能 够 以 大 写字 母 打 印 16 进 
制 的 数值 这 一 特性 要 更 为 有 用 , 因此 %X 的 含义 就 被 改 成 了 现在 这 个 样子 。 同 时， 
%D 和 %O 格式 项 也 被 废止 了 。 

过 去 ， 要 打印 一 个 数值 并 在 它 前 面 填充 0， 唯 一 的 办 法 就 是 使 用 标志 字符 0。 
标志 字符 0 的 作用 是 指定 待 打印 的 数值 前 应 该 填充 0 而 不 是 空白 字符 。 因 此 ， 

printf{("%06d %06d\n", -37, 37); 

将 打印 出 : 

-00037 000037 

然而 ， 当 我 们 要 打印 16 进 制 的 数值 或 希望 左 端 对 齐 时 ， 如 果 还 采用 这 种 定 
义 方式 ， 那 么 各 种 因素 交错 在 一 起 就 会 得 到 相当 “怪异 ”的 结果 。 其 实 ， 我 们 完 
全 可 以 采用 一 种 更 好 的 方式 ， 即 使 用 精度 修饰 符 : 

printf{("%.6G %.6G\n", -37, 37}); 


将 打印 出 ; 
-000037 000037 


在 大 多 数 场合 ， 我 们 都 可 以 用 % .来 奉 换 %0， 效 果 也 非常 接近 。 


A.2 使 用 varargs.h 来 实现 可 变 参 数列 表 


在 编写 C 程序 的 过 程 中 ， 随 着 程序 规模 的 增 大 ， 程 序 员 经 常 感到 有 必要 进行 
系统 化 的 错误 处 理 。 很 自然 可 以 想到 一 个 办 法 ， 就 是 创建 一 个 函数 ， 不 妨 称 之 为 
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error， 调 用 的 参数 顺序 与 printf 相同 ， 因 此 ， 
error("%d is out of bounds", x); 


就 与 下 式 等 效 


fprintf (stderr, "error: %d is out of bounds\n", x); 
exit {1),; 


要 实现 这 样 一 个 函数 可 以 说 是 轻而易举 ,只 是 有 一 个 小 细节 “ 梗 ” 住 了 我 们 : 
error 函数 的 参数 数目 与 类 型 在 不 同 的 调用 间 并 非 一 成 不 变 ， 而 是 像 printf 函数 屠 
样 可 能 随 调用 的 不 同 而 变动 。 一 个 典型 的 解决 之 道 是 把 error 函数 写成 像 下 面 这 
样 ， 可 惜 这 种 做 法 并 不 正确 。 


void error{la, b, c, d, e, f, g, h, i, j, k) 
{ 
fprintf (stderr, “error: "); 
fprintflstderr, a, b, c, d, e, f, g, h, i, j, Kk)}; 
fprintf (stderr, "\n"); 
exit (1); 
} 


编程 者 的 想法 是 通过 函数 error 的 参数 列表 来 搜集 一 组 必要 的 数据 , 然后 将 其 
传递 给 fprintf 函数 。 因 为 参数 a 到 k 并 没有 声明 ， 所 以 它们 默认 为 int 类 型 。 当 
然 ，error 函数 至 少 包括 了 一 个 非 int 类 型 的 参数 〈 即 格式 字符 串 )。 因 此 ， 这 个 程 
序 能 否 工作 就 依赖 于 是 否 可 以 使 用 一 组 整 型 参数 来 复制 任意 类 型 的 数值 。 

在 某 些 机 型 上 ， 我 们 无 法 做 到 这 一 点 。 即 使 我 们 可 以 做 到 ， 其 效果 也 是 有 限 
的 : 如 果 error 函数 的 参数 足够 多 〈 比 如 ， 超 过 上 例 中 的 11 个 )， 某 些 参数 肯定 要 
丢失 。 但 是 ， 既 然 printf 函数 能 够 做 得 到 ， 那 么 必定 存在 一 种 办 法 ， 可 以 传递 可 
变 参 数列 表 给 一 个 函数 。 

printf 函数 的 第 1 个 参数 必须 是 一 个 字符 串 , 我 们 可 以 通过 检查 这 个 字符 串 来 
得 到 其 他 参数 的 数目 与 类 型 〈 当 然 ， 假 定 对 printf 函数 的 调用 是 正确 的 )。 这 一 事 
实 ， 使 得 printf 函数 实现 可 变 参数 列表 的 难度 大 大 降低 了 。 我 们 需要 做 的 ， 就 是 
找到 printf 函数 用 以 存 取 变 长 参数 列表 的 机 制 。 

为 便于 printf 函数 的 实现 ， 这 样 一 种 机 制 应 该 拥有 以 下 特性 : 

。 只 需要 知道 函数 的 第 1 个 参数 的 类 型 ， 就 可 以 对 其 进行 存 取 。 

。 一 旦 第 n 个 参数 被 成 功 地 存 取 ， 第 n+1 个 参数 就 可 以 在 仅 知道 类 型 的 情 
况 下 进行 存 取 。 
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。 按 这 种 方式 存 取 一 个 参数 所 需 的 时 间 不 应 太 多 。 

需要 特别 注意 的 是 ， 逆 向 存 取 参 数 ， 或 者 随机 存 取 参 数 ， 或 者 以 任何 非 从 头 
到 尾 的 顺序 方式 来 存 取 参数 ， 都 是 不 必要 的 。 进 一 步 来 说 ， 检 测 参数 列表 是 否 结 
束 通常 既 不 必要 ， 也 不 可 能 。 

大 多 数 C 语言 实现 都 是 通过 一 组 总 称 为 varargs 的 宏 定义 来 达到 上 述 且 的 。 
这 些 宏 的 确切 性 质 虽然 与 特定 的 C 语言 实现 有 关 , 但 是 只 要 我 们 在 程序 中 运用 得 
当 ， 还 是 能 够 在 相当 多 的 机 型 上 使 用 可 变 参 数列 表 。 

任何 一 个 程序 ， 只 要 用 到 varargs 中 的 宏 ， 都 应 该 像 下 面 这 样 : 

#include <varargs.h> 

以 在 程序 中 把 相关 的 宏 定 义 包括 进来 。 varargs.h 头 文件 中 定义 了 宏 名 va_list， 
Va_dcl，va_start，va_end 以 及 va_arg。va_alist 一 般 由 编程 者 来 定义 ， 我们 马上 将 
讨论 如 何 来 做 。 需 要 强调 ， 应 该 避免 混淆 va_list 与 va_alist。 

任何 一 个 C 语言 实现 中 ， 对 于 可 变 参数 列表 的 第 n 个 参数 ， 在 已 知 其 类 型 的 
情况 下 ， 要 对 其 进行 存 取 还 需要 一 些 额外 的 信息 。 这 些 信 息 是 通过 已 经 可 以 存 取 
的 第 1 个 参数 到 第 n-1 个 参数 而 间接 得 到 的 ， 可 以 把 它 看 做 一 个 指向 参数 列表 内 
部 的 指针 。 当 然 ， 在 某 些 机 型 上 具体 的 实现 可 能 要 复杂 得 多 。 

这 些 信 息 存储 在 一 个 类 型 为 va_list 的 对 象 中 。 因 此 ， 当 我 们 声明 了 一 个 名 称 
为 ap 的 类 型 为 va_list 的 对 象 后 ， 只 需要 给 定 ap 与 第 1 个 参数 的 类 型 就 可 以 确定 
第 1 个 参数 的 值 。 

通过 va_list 存 取 一 个 参数 之 后 ，va_list 将 被 更 新 ， 指 向 参数 列表 中 的 下 一 个 
参数 。 

因为 一 个 va_list 中 包括 了 存 取 全 部 参数 的 所 有 必要 信息 ， 函 数 于 可 以 为 它 的 
参数 创建 一 个 va_list， 然 后 把 它 传递 给 另 一 个 函数 g。 这 样 ， 函 数 g 就 能 够 访问 
到 函数 f 的 参数 。 

例如 ， 在 许多 C 语言 实现 中 ，printf 函数 族 中 的 三 个 函数 〈printf、fprintf 和 
sprintf)， 它 们 都 调用 了 一 个 公共 的 子 函数 。 而 对 这 个 子 函 数 来 说 ， 获 取 它 的 调用 
函数 的 参数 就 很 重要 。 

被 调用 时 带 有 可 变 参 数列 表 的 函数 ， 必 须 在 函数 定义 的 首部 使 用 va_alist 和 
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va_dcl 宏 。 如 下 所 示 : 


#include <varargs.h> 
void error (va_alist) va_dcl 


宏 va_alist 将 扩展 为 特定 C 实现 所 要 求 的 参数 列表 ， 这 样 函数 就 能 够 处 理 变 
长 参数 。 而 宏 va_dcl 将 扩展 为 与 参数 列表 对 应 的 声明 ， 必 要 时 还 包括 一 个 作为 语 
名 结束 标志 的 分 号 。 

我 们 的 error 函数 必须 创建 一 个 va_list 变量 , 把 变量 名 传递 给 宏 va_start 来 初 
始 化 该 变量 。 这 样 做 之 后 ， 就 可 以 逐个 读 取 error 函数 参数 列表 中 的 参数 了 。 当 程 
序 不 再 用 到 参数 列表 中 的 参数 时 ， 我 们 必须 以 va_list 变量 名 为 参数 来 调用 宏 
va_end， 表 示 不 再 需要 用 到 va_list 变量 了 。 


我 们 的 error 函数 于 是 进一步 扩展 为 : 


#include <varargs.h> 
void error (va_alist) va_dcl 
{ 
va_list ap; 
va_start {ap}); 
/ /这 里 是 使 用 ap 的 程序 部 分 
va_end (ap); 
// 这 里 是 不 使 用 ap 的 其 他 程序 部 分 
} 


我 们 务必 记 住 ， 在 使 用 完 va_list 变量 后 一 定 要 调用 宏 va_end。 在 大 多 数 C 
实现 上 ,调用 va_end 与 否 并 无 区 别 。 但 是 , 某 些 版 本 的 va_start 宏 为 了 方便 对 va_list 
进行 遍历 ， 就 给 参数 列表 动态 分 配 内 存 。 这 样 一 种 C 实现 很 可 能 利用 va_end 宏 
来 释放 此 前 动态 分 配 的 内 存 ， 如 果 忘 记 调用 宏 va_end， 最 后 得 到 的 程序 可 能 在 某 
些 机 型 上 没有 什么 问题 ， 而 在 另 一 些 机 型 上 则 发 生 “内 存 泄漏 ”。 

宏 va_arg 用 于 对 一 个 参数 进行 存 取 。 它 的 两 个 参数 分 别 为 va_list 变量 名 和 希 
望 存 取 的 参数 的 数据 类 型 。va_list 宏 将 取得 这 个 参数 ， 并 更 新 va_list 变量 ， 使 其 
指向 下 一 个 参数 。 因 此 ， 我 们 的 error 函数 现在 看 上 去 成 了 下 面 这 个 样子 : 


#include <varargs.h> 
void error (va_alist) va_dcl 
{ 

va_list ap; 

char *format; 


161 


C 陷 潮 与 缺陷 


va_start (ap}); 
format = va_arg(ap, char *); 
fprintf (stderr, "error: ");} 


// (do something magic) // 某 些 实现 方式 暂时 未 知 的 工作 


va_endl(ap);: 
fprintf (stderr, "\n"); 
exit (1 工 ) ; 
} 
现在 我 们 暂时 受阻 了 : 没有 办 法 让 printf 函数 接受 一 个 va_list 变量 作为 参数 。 
我 们 又 确实 需要 做 到 这 一 点 ， 正 如 “do something magic 〈 某 些 实现 方式 暂时 未 知 
的 工作 )” 的 注释 所 表明 的 那样 ， 但 是 如 何 能 做 到 呢 ? 


幸运 的 是 ，ANSI C 标准 要 求 ， 而 且 很 多 C 语言 实现 也 提供 了 ， 分 别称 为 
vprintt、vfprintf 和 vsprintf 的 函数 。 这 些 函 数 与 对 应 的 printf 函数 族 中 的 函数 在 行 
为 方式 上 完全 相同 ， 只 不 过 用 va_list 替换 了 格式 字符 串 后 的 参数 序列 。 这 些 函数 
之 所 以 能 够 存在 , 理由 有 两 个 : 其 一 , va_list 变量 可 以 作为 参数 传递 ; 其 二 , va_arg 
宏 可 以 独立 出 现在 一 个 函数 中 ， 并 不 强制 要 求 与 va_start 宏 〈 该 宏 的 作用 是 初始 
化 va_list 变量 ) 成 对 使 用 。 


因此 ，error 函数 的 最 终 版 本 如 下 所 示 ; 


#include <stdio.h> 
#include <varargs.h> 
void error (va_alist) va_dcl 
{ 
va_list ap; 
char *format,; 


va_start {ap}); 
format = va_argl(lap, char *); 
fprintf (stderr, "error: "); 
vfprintf (stderr, format, ap); 
va_end (ap},， 
fprintf{stderr, "\n"); 
exit{1); 

} 


下 面 还 有 一 个 例子 ， 我 们 将 演示 利用 vprintf 来 实现 printf 函数 的 一 种 可 行 方 
式 。 注 意 ， 不 要 忘记 保存 vprintf 函数 的 结果 ， 我 们 需要 把 这 个 结果 返回 给 printf 
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函数 的 调用 者 。 


#include <varargs.h> 


int printf (va_alist} va_dcl 
{ 

va_list ap; 

char *format,; 

int n; 


va_start (ap); 

format = va_arg(lap, char *); 
n = vprintf (format, ap); 
va_end (ap); 

return n; 


) 
实现 varargs.h 


varargs.h 的 一 个 典型 实现 包括 一 组 宏 ， 以 及 一 个 va_list 的 typedef 声明 : 


typedef char *va_list; 
#define va_dcl int va alist; 
#define va._start {list) list = (char *)&Va aliSst 
#define va_end(list) 
#define va_arg(list,mode) \ 
((mode *) (list += sizeof (mode)))i{-1] 


我 们 首先 注意 到 ， 在 这 个 版 本 的 varargs.h 中 ，va_alist 甚至 不 是 一 个 宏 : 


#include <varargs.h> 
void error {va_alist) va_dcl 


将 扩展 为 : 


typedef char *va_list; 
void error (va_alist) int va_alist,; 


因此 ， 一 个 接受 可 变 参数 列表 的 函数 表面 上 看 来 只 有 一 个 名 称 为 va_alist 的 int 型 
参数 。 

这 个 例子 实际 上 隐 含 了 如 下 假定 : 底层 的 C 语言 实现 要 求 函数 参数 在 内 存 中 
连续 存储 ， 这 样 我 们 只 需 知 道 当前 参数 的 地 址 ， 就 能 依次 访问 参数 列表 中 的 其 他 
参数 。 因 此 ,varargs.h 的 这 个 实现 中 ,va_list 就 只 是 一 个 简单 的 字符 指针 。 宏 va_start 
把 它 的 参数 设置 为 va_alist 的 地 址 (为 避免 lint 程序 的 警告 , 这 里 做 了 类 型 转换 )。 
而 宏 va_end 则 什么 也 不 做 。 
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最 复杂 的 宏 是 va_arg。 它 必须 返回 一 个 由 va_list 所 指向 的 恰当 类 型 的 数值 ， 
同时 递增 va_list, 使 它 指向 参数 列表 中 的 下 一 个 参数 ( 即 递增 的 大 小 等 于 与 va_arg 
宏 所 返回 的 数值 具有 相同 类 型 的 对 象 的 长 度 )。 因 为 类 型 转换 的 结果 不 能 作为 赋值 
运算 的 目标 (译注 : 即 只 能 先 赋值 再 作 类 型 转换 ， 而 不 能 先 类 型 转换 再 赋值 )， 所 
以 va_arg 宏 首先 使 用 sizeof 来 确定 需要 递增 的 大 小 ,然后 直接 把 它 加 到 va_list 上 ， 
这 样 得 到 的 指针 再 被 转换 为 要 求 的 类 型 。 因 为 该 指针 现在 指向 的 位 置 “ 过 ”了 一 
个 类 型 单位 的 大 小 ， 所 以 我 们 使 用 了 下 标 -1 来 存 取 正 确 的 返回 参数 。 

这 里 有 一 个 “陷阱 ”需要 避免 ，va_arg 宏 的 第 二 个 参数 不 能 被 指定 为 char、 
short 或 float 类 型 。 因 为 char 和 short 类 型 的 参数 会 被 转换 为 int 类 型 ， 而 float 类 
型 的 参数 会 被 转换 为 double 类 型 。 如 果 错 误 地 指定 了 ， 将 会 在 程序 中 引起 麻烦 。 

例如 ， 这 样 写 肯定 是 不 对 的 ; 

c= va_argl(ap,char}): 
因为 我 们 无 法 传递 一 个 char 类 型 参数 ， 如 果 传 递 了 ， 它 将 会 被 自动 转换 为 int 类 
型 。 上 面 的 式 子 应 该 写成 : 

c = va_argl(ap,int); 

另 一 方面 ,如果 cp 是 一 个 字符 指针 , 而 我 们 又 需要 一 个 字符 指针 类 型 的 参数 ， 

上 面 这 样 写 就 完全 正确 ; 

cp = va_arglap',char *); 

当 作为 参数 时 ， 指 针 并 不 会 被 转换 ， 只 有 char、short 和 float 类 型 的 数值 才 
会 被 转换 。 

我 们 还 应 该 注意 到 ， 不 存在 任何 内 建 的 方式 来 得 知 给 定 的 参数 数 且 。 使 用 
varargs 系列 宏 的 每 个 程序 ， 都 有 责任 通过 确立 某 种 约定 或 惯例 来 标志 参数 列表 的 
结束 。 例如，printf 函数 使 用 格式 字符 串 作 为 第 一 个 参数 ,来 确定 其 余 参 数 的 数目 
与 类 型 。 


A.3 stdarg.h: ANSI 版 的 varargs.h 


头 文件 varargs.h 中 系列 宏 的 历史 最 早 可 追溯 到 1981 年 ， 因 此 许多 C 语言 实 
现 都 对 其 提供 支持 。 然 而 ，ANSI C 标准 却 包括 了 另 一 种 不 同 的 机 制 〈 称 为 
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stdarg.h)， 来 处 理 可 变 参数 列表 。 

本 书 7.1 节 的 讨论 ， 无 论 是 对 于 C 语言 用 户 还 是 实现 者 ， 在 这 里 仍然 是 适用 
的 。 在 符合 ANSI C 标准 的 编译 器 中 包括 varargs.h 作为 功能 上 的 一 种 扩展 ， 这 是 
个 不 错 的 主意 , 可 以 让 早期 的 程序 继续 运行 。 因此, 在 编程 实践 中 , 使 用 varargs.h 
的 程序 比 使 用 stdarg.h 的 程序 可 移植 性 要 强 ， 能 够 运行 其 上 的 系统 平台 也 要 多 -- 
些 。 但 如 果 你 要 编写 一 个 遵循 ANSI C 标准 的 程序 ， 就 必须 使 用 stdarg.h， 而 且 别 
无 他 选 ! 这 是 一 个 让 人 左右 为 难 的 情形 ， 不 管 作出 何 种 选择 ， 都 必须 付出 相应 代 
价 。 


我 们 观察 到 ， 具 有 可 变 参 数列 表 的 函数 ， 它 们 的 第 1 个 参数 的 类 型 在 每 次 调 
用 时 实际 上 都 是 不 变 的 。varargs.h 和 stdarg.h 的 主要 区 别 就 来 自 于 这 一 事实 。 类 
似 printf 这 样 的 函数 ， 可 以 通过 检查 它 的 第 1 个 参数 ， 来 确定 它 的 第 2 个 参数 的 
类 型 。 但 是 ,从 参数 列表 中 我 们 却 不 能 找到 任何 信息 用 以 确定 第 1 个 参数 的 类 型 。 
因此 ， 使 用 stdarg.h 的 函数 必须 至 少 有 一 个 固定 类 型 的 参数 ， 后 面 可 以 跟 一 组 未 
知 数目 、 未 知 类 型 的 参数 。 


作为 一 个 现成 的 例子 ， 让 我 们 再 来 看 一 下 error 函数 。 它 的 第 1 个 参数 就 是 
printf 函数 中 的 格式 字符 串 ， 为 字符 指针 类 型 。 因 此 ，error 函数 可 以 如 下 声明 : 


void error (char *, ...); 

那么 error 函数 的 定义 又 是 怎样 昵 ?stdarg.h 头 文件 中 并 没有 varargs.h 中 的 
va_arg 和 va_dcl 宏 。 使 用 stdarg.h 的 函数 直接 声明 其 固定 参数 ， 把 最 后 一 个 固定 
参数 作为 va_start 宏 的 参数 ， 即 以 固定 参数 作为 可 变 参 数 的 基础 。 因 此 ，error 机 
数 的 定义 如 下 所 示 : 


#include <stdio.h> 
#include <stdarg.h> 


void error(char *format, ...) 
{ 
va_list ap:; 
va_start (ap, format); 
fprintf (stderr, "error: ");，: 
vfprintf{stderr, format, ap); 
va_end (ap); 
fprintf(stderr, "“\n"); 
exit (1); 
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本 例 中 ， 我 们 无 需 使 用 va_arg 宏 ， 因 为 此 处 格式 字符 串 属 于 参数 列表 的 固定 
部 分 。 


作为 另 一 个 例子 ， 下 面 演示 了 如 何 使 用 stdarg.h 来 编写 printf (其 中 用 到 了 
vprintf ): 





#include <stdarg.h> 


int 
printf (char *format, ...) 
{ 

va_list ap; 

int n; 


va_Start (ap,format) ， 

n = vprintf (format, ap); 
va_end (lap}; 

return n; 







附录 B Koenig 和 Moo 夫妇 访谈 
作者 : Andrew Koenig, Barbara Moo 
采访 ， 王 虹 ， 孟 岩 
译 者 : 孟 岩 





【 译 者 注 】Andrew Koenig 和 Barbara Moo 夫妇 是 C++ 领域 内 国际 知名 的 技术 
专家 、 技 术 作家 和 教育 家 。 最 近 , 他 们 的 几 部 著名 作品 《C++ 沉 思 录 》(Ruminations 
on C++), 《C 陷阱 与 缺陷 》(C Traps and Pitfalls) 和 Accelerated C++ 中 文 版 即将 问 
志 。 作 为 C++ View 的 成 员 和 《C++ 沉思 录 》 一 书 的 技术 审 校 ， 我 与 C++ View 电 
子 杂 志 的 主编 王 赚 一 起 对 Koenig 夫妇 进行 了 一 次 E-mail 采访 。 下 面 是 这 次 采访 
的 中 文 译 稿 。 

【Koenig 的 悄悄 话 】 你 们 问 的 问题 ， 我 们 已 经 答复 如 下 。 大 部 分 问题 ， 我 们 
都 是 分 别 回答 的 ， 有 些 问 题 我 们 两 个 一 起 回答 ， 个 别 情况 ， 只 有 一 个 人 作答 。 我 
们 是 在 尼亚加拉 瀑布 度假 期 间 完成 这 次 采访 的 ， 我 脑子 里 一 直 在 想 ， 对 我 们 的 中 
国 读者 说 些 什 么 好 呢 ? 这 事 想 得 我 头疼 。 也许 结束 度假 之 后 , 我 们 能 说 得 更 好 些 。 

提问 : 请 向 我 们 介绍 你 们 自己 的 一 些 情况 好 吗 ? “Koenig” 是 个 德国 姓 吗 ? 
怎么 发 音 呢 ? “Moo” 呢 ? 

Koenig: “Koenig ”是 一 个 很 常见 的 德国 姓 ， 在 德 文 里 写成 “Kinig”， 意 义 
是 “国王 《king)”。 不 过 我 的 情况 很 特殊 。 我 祖上 是 波兰 和 乌克兰 人 ， 不 是 德国 
人 。 这 个 名 字 其 实 是 一 个 长 长 的 波兰 姓氏 的 缩写 。 我 读 自 己 名 字 的 时 候 ， 重 音 放 
在 前 面 的 音节 ， 整 体 的 音韵 类 似 “go” 的 发 音 。 而 一 些 与 我 同名 的 人 发 音 时 ， 第 
一 个 音节 的 音韵 类 似 “way” 的 发 音 ， 我 们 家 里 人 从 来 不 这 么 说 。 


Moo: 谈 到 我 这 个 姓氏 ， 最 重要 的 一 点 就 是 ， 其 发 音 跟 牛 叫 的 声音 一 模 一 样 
一 一 当 我 还 是 孩子 的 时 候 ， 小 伙伴 们 经 常 模仿 牛 叫 声 来 取笑 我 。 我 父辈 从 斯 堪 迪 
纳 维 亚 移民 来 美国 ， 这 个 姓 是 个 挪威 姓 。 我 在 自己 的 C++ 技术 生涯 中 最 快乐 的 时 
刻 之 一 ,就 是 在 遇 到 Simula 阵营 里 的 Kristen Nygaard 时 , 他 告诉 了 我 这 个 姓氏 的 
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起 源 。 他 说 这 个 姓氏 多 少 反映 了 我 祖先 居住 的 地 方 一 一 Moo 是 一 个 很 少见 的 挪威 
姓氏 ， 其 意义 是 “荒芜 的 平原 ”， 既 不 是 亚 欧 大 陆 上 那 种 一 望 无 际 、 水 草 丰 成 的 大 
草原 ， 也 不 是 沙漠 。 我 想 不 是 个 很 浪漫 的 姓氏 ， 不 过 能 够 跟 祖 先 联 系 起 来 ， 还 是 
很 有 趣 的 。 

顺便 一 提 ， 中 国 读者 可 能 会 对 以 下 事实 感 兴趣 。 很 多 人 在 见 到 我 之 前 ， 都 以 
为 我 是 中 国人 。 我 甚至 收 到 过 来 自 中 国 的 电话 推销 ， 希 望 我 去 中 国 作 一 次 远程 旅 
行 ， 认 祖 归 宗 。 

提问 : Stanley Lippman 在 Inside the C++ Object Model 一 书 中 提 到 了 贝尔 实 
验 室 的 Foundation 项 目 ， 他 这 么 说 :“ 这 是 一 个 很 令 人 激动 的 项 目 ， 不 仅仅 因为 
我 们 所 作 的 事情 令 人 激动 ， 而 且 我 们 的 团队 同样 令 人 激动 Bjarne, Andy Koenig， 
Rob Murray, Martin Carroll, Judy Ward, Steve Buroff, Peter Juhl， 当 然 还 有 我 自己 。 
除了 Bjame 和 Andy 之 外 所 有 的 人 都 归 Barbara Moo 管理 。 她 经 常 说 ， 管 理 一 个 
软件 开发 团队 ， 就 像 放 牧 一 群 骄傲 的 猫 .” 请 问 ， 这 段 与 Bjarne 和 其 他 人 共事 的 
日 子 ， 对 你 们 二 位 真 地 那么 美好 吗 ? 

Koenig: 那 一 段 日 子 ， 在 我 看 来 ， 不 过 是 我 长 达 15 年 的 C++ 生涯 中 的 一 部 分 ， 
而 Foundation 项 目 里 的 人 也 只 不 过 是 一 个 更 大 社 群 中 的 一 部 分 。 当 时 我 己 经 开始 
在 标准 委员 会 中 开展 工作 ， 所 以 我 不 仅 要 与 同一 屋 榴 下 的 人 讨论 ， 还 要 经 常 与 全 
世界 各 地 的 数 十 位 C++ 程 序 员 互相 交流 。 

Moo: 我 倒是 更 喜欢 当年 围绕 Cfront 的 那 段 工作 经 历 ，Cfront 是 最 早 的 C+t+ 编 
译 器 ， 那 是 一 个 伟大 的 团队 ， 而 且 我 们 处 于 一 个 新 语言 的 创造 中 心 ， 一 种 新 的 、 
更 好 的 工作 方法 的 创造 中 心 。 那 是 一 段 令 人 激动 的 时 光 , 我 将 永远 保存 在 记忆 里 。 

提问 : 作为 C++ 标准 委员 会 的 项 目 编辑 ， 哪 件 事情 最 令 您 激动 ? 我 们 都 知道 ， 
是 您 鼓励 Alex Stepanov 向 标准 委员 会 提交 STL， 并 建议 将 其 并 入 标准 库 。 关 于 这 
个 传奇 故事 ， 您 还 能 向 我 们 透露 一 些 细节 吗 ? 

Koenig: 那 次 Barbara 和 我 跑 到 位 于 加 州 保罗 阿尔 托 的 斯 坦 福 大 学 去 教授 一 星 
期 的 C++ 课 。 当 时 Alex Stepanov 在 惠普 实验 室 工作 ， 也 在 保罗 阿尔 托 ， 我 们 以 前 
在 AT&T 共 事 过 ， 所 以 对 他 以 前 的 工作 有 所 了 解 。 很 自然 的 ， 我 们 邀请 他 共 进 午 
餐 。 席 间 他 非常 兴奋 地 提起 他 和 他 的 同事 正在 开发 的 一 个 C++ 库 。 

不 久之 后 ， 标 准 委员 会 在 圣何塞 开会 ， 那 里 距离 保罗 阿尔 托 只 有 不 到 一 小 时 
车 程 。 我 觉得 Alex 的 想法 实在 很 有 意思 ,就 邀请 他 给 标准 委员 会 的 成 员 讲 了 一 课 。 
我 们 都 觉得 ， 当 时 标准 化 的 工作 已 经 十 分 接近 完成 ， 他 的 工作 不 可 能 对 标准 构成 
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什么 影响 。 但 是 ， 我 们 至 少 应 该 让 委员 会 成 员 知 道 它 的 存在 ， 起 码 以 后 我 们 可 以 
说 STL 是 被 拒 了 ， 而 不 是 我 们 孤 陋 寡 闻 ， 致 有 和 遗 珠 之 憾 。 

那 次 交流 会 是 我 所 参加 过 的 技术 报告 中 最 令 人 激动 的 几 个 之 一 。 在 长 长 的 一 
天 之 后 ， 会 议 接近 结束 的 时 候 ， 一 半 人 已 经 疲惫 不 堪 一 一 可 是 Alex 的 精力 极其 充 
沛 ， 而 且 他 的 思想 如 此 先进 ， 大 大 超越 我 们 以 前 见 过 的 任何 东西 。 因 此 ， 当 会 议 
快 结束 时 ， 委 员 们 开始 认真 地 讨论 ， 是 否 应 该 将 这 个 库 并 入 C++ 标准 。 

当然 ， 后 来 这 个 库 就 被 渐渐 纳入 标准 ， 但 其 实际 过 程 还 是 相当 惊险 的 。 有 好 
几 次 至 关 重 要 的 投票 ， 都 可 以 把 它 扼杀 掉 。 有 一 次 ， 程 序 库 子 委员 会 甚至 决定 投 
票 拒绝 考虑 Alex 的 建议 ， 幸 好 我 及 时 指出 ， 我 们 通常 的 议事 规程 是 ， 先 解决 旧 的 
议题 , 然后 再 考虑 新 的 议题 , 就 算是 准备 拒绝 建议 , 也 不 应 该 违例 。 我 们 围绕 Alex 
的 建议 展开 了 大 量 的 讨论 ， 最 后 ， 终 于 有 足够 多 的 人 改变 了 主意 ， 促 使 委员 会 逐 
渐 接 受 了 它 。 

提问 :你 们 二 位 对 于 现在 的 C++ 教育 状况 怎么 看 ? 我 们 是 否 应 该 更 加 重视 标 
准 库 教 育 ， 而 不 是 语言 细节 的 教育 ? 或 者 你 们 有 别 的 看 法 ? 

Koenig: 当前 C++ 的 教育 状况 实在 太 糟糕 了 。 很 多 所 谓 的 C++ 教材 不 过 是 C 语 
言 书 ， 只 是 在 结尾 粘贴 一 点 点 C++ 的 材料 而 已 。 结 果 昵 ， 他 们 告诉 读者 ， 字 符 串 
乃 是 定 长 字符 数组 ， 应 该 用 标准 库 中 的 sttcpy 和 strcmp 来 操作 。 一 个 程序 员 一 旦 在 
一 开始 掌握 了 这 些 东西 ， 就 会 根深 蒂 固 ， 多 年 挥 之 不 去 。 


就 其 本 身 而 言 ，C++ 是 一 种 非常 低级 的 语言 。 唯 有 利用 库 ， 才 能 写 出 高 层次 
的 程序 来 。 初 学 者 还 不 能 自己 构造 库 ， 所 以 他 们 要 么 用 现成 的 标准 库 ， 要 么 自己 
去 写 低层 次 的 程序 。 确 实 有 不 少 程序 应 该 用 低层 次 技术 来 构造 ， 但 是 对 于 初学 者 
不 合适 。 

Moo: 当然 是 库 优 于 语言 细节 。 两 个 原因 : 首先 ， 学 生 们 可 以 不 必 费 力 包装 
低层 次 的 语言 细节 ， 从 而 更 容易 建立 整体 语言 的 全 局 观念 ， 了 解 到 其 真实 威力 。 
根据 我 们 的 经 验 ， 学 生 们 首先 掌握 如 何 使 用 程序 库 之 后 ， 就 会 很 容易 理解 类 的 概 
念 ， 学 会 如 何 构 造 类 的 技术 。 如 果 首 先 去 学 习 语言 细节 ， 那 么 就 很 难 理解 类 的 概 
念 及 其 功能 。 这 种 理解 上 的 缺陷 ， 使 他 们 很 难 设计 和 构造 自己 的 类 。 


不 过 ， 更 重要 的 一 点 是 ， 首 先 学 习 程 序 库 ， 能 够 使 学 生 培 养 起 良好 的 习惯 ， 
就 是 复 用 库 代 码 ， 而 不 是 凡事 自己 动手 。 首 先 学 习 语言 细节 的 学 生 ， 最 后 的 编程 
风格 往往 是 C 类 型 的 ， 而 不 是 C++ 风格 。 他 们 不 会 充分 地 运用 库 ， 而 自己 的 程序 带 
有 严重 的 C 主 义 倾 向 一 一 指针 满天飞 ， 整 个 程序 都 是 低层 次 的 。 结 果 是 ， 在 很 多 
情况 下 ， 你 为 C++ 的 复杂 性 付出 了 高 昂 代 价 ， 却 没有 从 中 获得 任何 好 处 。 


提问 : 在 《C++ 沉思 录 》 中 ， 你 们 提 到 :“C++ 希 望 面 对 把 实用 性 放 在 首位 的 
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社 群 >。 不 过 在 实践 中 ， 很 多 程序 员 都 在 抱 急 ， 要 形成 一 个 好 的 C++ 设计 实在 是 太 
难 了 ， 他 们 觉得 Java 甚 至 老式 的 C 诸 诗 都 比 C++ 更 为 实用 。 这 种 看 法 有 什么 错误 
吗 ? 你 们 对 奉行 实用 主义 的 C++ 程序 员 有 何 建 议 ? 

Koenig: 你 们 中 国人 有 没有 类 似 这 样 的 谚语 ;“ 糟 糕 的 手艺 人 常常 责怪 自己 的 
工具 ”? 还 有 一 名 ,“ 当 你 手 里 拿 着 锤子 的 时 候 ， 整 个 世界 都 成 了 钉子 ”。 

编程 问题 彼此 不 同 。 在 我 看 来 ， 就 一 个 问题 产生 良好 的 设计 方案 的 途径 ， 就 
是 使 用 一 种 允许 你 进行 各 种 设计 的 工具 。 这 样 一 来 ， 你 就 可 以 选择 最 适合 该 问题 
的 设计 方案 。 如 果 你 选择 了 这 样 的 本 其 , 那么 你 就 必须 负责 选择 合适 的 设计 方案 。 

Moo: 关于 这 个 问题 ， 我 想 用 一 个 项 目的 实例 来 说 明 ， 那 时 AT&T 最 早 采用 
C++ 开 发 的 项 目 之 一 。 他 们 在 写 一 个 已 经 建成 的 系统 的 第 二 版 ， 所 以 认为 对 问题 
域 已 经 有 足够 深入 的 了 解 。 他 们 估计 学 习 C++ 是 整个 工作 中 比较 困难 的 一 部 分 。 
然而 实际 上 ， 他 们 在 开发 中 发 现 ， 他 们 对 问题 领域 并 没有 很 好 的 理解 。 于 是 花费 
了 大 量 的 时 间 来 形成 正确 的 抽象 。 设 计 是 很 困难 的 ， 语 言 问题 相对 容易 得 多 。 我 
们 相信 ，C++ 在 运行 时 性 能 上 做 了 一 个 很 好 的 折 中 ， 能 够 在 “一 切 都 是 对 象 ”的 
语言 与 “避免 任何 抽象 ”的 语言 之 间 取 得 恰到好处 的 平衡 。 这 就 是 C++ 的 实用 性 。 

提问 : 有 一 点 看 起 来 你 们 与 几乎 所 有 的 C++ 技术 作家 意见 不 同 。 其 他 人 都 高 
声 宣扬 ， 面 向 对 象 编程 乃 是 C++ 最 重要 的 一 面 。 而 你 们 认为 模板 才 是 最 重要 的 。 
我 仔细 阅读 了 《C++ 沉思 录 》 中 有 关 OOP 的 章节 ， 发 现 你 们 所 给 出 的 几 个 例子 和 
解决 方案 在 某 些 方面 是 很 相似 的 。 你 们 是 否认 为 所 有 “良好 ”的 面向 对 象 解决 方 
案 都 具有 某 种 共同 的 特质 ? 是 否 在 很 多 情况 下 , OO 都 不 如 其 他 的 风格 ? 为 什么 认 
为 “基于 对 象 ” 和 “基于 模板 ”的 抽象 机 制 优先 于 面向 对 象 抽象 机 制 ? 

Koenig: 所 谓 面向 对 象 编程 ， 就 是 使 用 继承 和 动态 绑 定 机 制 编程 。 如 果 你 知 
道 有 -- 个 很 好 的 程序 使 用 了 继承 和 动态 绑 定 , 你 能 做 出 怎样 的 推断 ?在 我 们 看 来 ， 
这 意味 着 该 程序 中 有 两 个 或 两 个 以 上 的 类 型 ， 至 少 有 一 个 共同 的 操作 ， 也 全 少 有 
一 个 不 同 的 操作 。 否 则 ， 就 不 需要 继承 机 制 。 此 外 ， 程 序 中 必然 有 一 个 场景 ， 需 
要 在 运行 时 从 这 些 类 型 中 挑选 出 一 个 ， 和 否则 就 不 需要 动态 绑 定 机 制 。 再 考虑 到 ， 
我 们 所 举 的 例子 必须 足够 短小 精 悍 ， 能 够 放 在 一 本 书 里 ， 还 不 能 让 读者 烦心 ， 所 
以 对 我 们 来 说 ， 很 难 在 所 有 这 些 限 制 条 件 下 想 出 很 多 不 同 的 程序 范例 。 

某 些 面向 对 象 编程 语言 ， 如 Python， 其 所 有 类 型 都 是 动态 的 ， 那 么 技术 书籍 
的 作者 就 不 会 面 对 这 样 的 问题 。 例 如 ，C++ 中 的 容器 类 大 多 数 用 模板 写成 ， 因 其 
可 以 容纳 毫 无 共同 之 处 的 对 象 ， 所 以 要 求 元 素 类 型 必须 是 某 个 共同 基 类 的 派生 类 
毫 无 道理 。 然 而 ， 在 Python 中 ， 容 器 类 中 本 来 就 可 以 放置 任何 对 象 ， 所 以 类 似 模 
板 那样 的 类 型 机 制 就 不 必要 了 。 
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所 以 ， 我 认为 你 所 看 到 的 问题 ， 其 实 是 因为 很 难 找到 又 小 又 好 的 面向 对 象 程 
序 来 做 范例 ， 才 会 产生 的 。 而 且 ， 对 于 其 他 语言 必须 烦 劳 动态 类 型 才能 解决 的 问 
题 ，C++ 能 够 使 用 模板 来 高 效 地 解决 。 

Moo: 我 同意 ， 我 们 写 的 东西 让 你 很 容易 地 得 出 上 述 结论 。 但 是 在 这 个 特例 
里 ， 我 不 认为 我 们 所 写 的 东西 代表 了 我 们 的 全 部 观点 。 我 们 针对 C++ 写 了 很 多 的 
介绍 性 和 提高 性 的 材料 。 在 这 本 书 里 ,“ 基 于 对 象 设计 ”中 的 抽象 机 制 就 已 经 很 难 
掌握 了 ， 而 又 必须 在 介绍 面向 对 象 方法 之 前 讲 清楚 。 所 以 ， 我 们 所 写 的 东西 实际 
上 是 想 展 示 我 们 这 样 的 观点 : 除非 你 首先 掌握 了 构造 良好 类 的 技术 ， 否 则 急 急忙 
忙 去 研究 继承 就 是 抠 苗 助长 。 


另 一 个 因素 是 ， 我 们 希望 用 例子 来 推进 我 们 的 教学 。 若 要 展示 良好 的 面向 对 
象 设计 ， 问 题 可 能 会 变 得 很 复杂 。 这 种 例子 没 法 很 快 掌握 ， 也 不 适合 那 本 书 的 风 
格 。 

提问 : 如 果 说 我 只 能 记 住 你 的 一 句 话 ， 那 一 定 是 这 句 :“ 用 类 来 表示 概念 ”。 
你 在 《C++ 沉思 录 》 这 本 书 里 ， 反 复 强调 这 句 话 ， 给 我 留 下 极其 深刻 的 印象 。 假 
设 我 能 再 记 住 一 句 话 ， 你 们 觉得 应 该 是 什么 ? 

Koenig & Moo: 避免 重复 。 如 果 你 发 现 自己 在 程序 的 两 个 不 同 部 分 里 做 了 相 
同 的 事情 ， 试 着 把 这 两 个 部 分 合并 到 一 个 子 过 程 中 。 如 果 你 发 现 两 个 类 的 行为 相 
近 ， 试 着 把 这 两 个 类 的 相似 部 分 统一 到 基 类 或 模板 中 。 

提问 : 你 们 在 《C++ 沉思 录 》 中 有 两 句 名 言 :“ 类 设计 就 是 语言 设计 ， 语 言 设 
计 就 是 类 设计 。” 你 们 对 C++ 标准 库 的 未 来 如 何 看 待 ? 人 们 是 应 该 开发 更 多 的 实用 
组 件 ， 比 如 boost::thread 和 regex++， 还 是 继续 激进 前 行 ， 支 持 不 同 的 风格 ， 像 
boost::lambda 和 boost::mpi 所 做 的 那样 ? 

Koenig: 我 觉得 现在 回答 这 个 问题 还 为 时 尚 早 。 从 根本 上 讲 ，C++ 语 言 反 映 
了 其 社 群 的 状况 ， 而 当前 整个 社 群 里 各 种 声音 都 有 。 我 看 还 需要 一 段 时 间 才 能 达 
成 共识 ， 确 定 发 展 的 方向 。 


提问 : 有 时 ， 编 写 平台 无 关 的 C++ 程序 比较 困难 ， 而 且 开 发 效率 也 不 能 满足 
需求 。 您 是 否认 为 把 C++ 与 其 他 的 语言 ， 尤 其 类 似 Python 和 TCL/TK 那 样 的 脚本 语 
言 合并 使 用 是 个 好 主意 ? 


Koenig: 是 的 。 我 最 近 在 学 习 Python， 得 出 的 看 法 是 ，Python 和 C++ 构成 了 完 
美的 一 对 组 合 。Python 程 序 比 相应 的 C++ 程序 短小 精 悍 ， 而 C++ 程序 则 比 Python 快 
得 多 。 因 此 ， 我 们 可 以 用 C++ 来 构造 那些 对 性 能 要 求 很 高 的 部 分 ， 然 后 用 Python 
把 它们 粘 在 一 起 。Boost 中 的 一 个 作者 Dave Abrahams 写 了 一 个 很 不 错 的 C++ 库 ， 
很 好 地 处 理 了 C++ 与 Python 的 接口 问题 ， 我 认为 这 是 一 个 好 的 想法 。 
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C 陷阱 与 缺陷 

提问 : 你 们 的 著名 作品 《C 陷阱 与 缺陷 》 《C++ 沉思 了 录 》 ai C++ 
中 文 版 即将 问世 。 想 对 你 们 的 中 国 读者 说 些 什 么 ? 

Koenig & Moo: 我 们 应 该 保持 谦虚 ， 有 很 多 人 已 经 从 我 们 的 书 中 学 到 了 一 些 
东西 。 我 们 很 高 兴 将 会 有 一 个 很 大 的 群体 成 为 我 们 读者 群 的 一 部 分 ， 希 望 你 们 从 
书 中 有 所 收获 。 

提问 :我 在 你 们 的 主页 上 看 到 不 少 漂亮 的 照片 ,你 们 有 没有 访问 中 国 的 计划 ? 
那 一 定 可 以 让 你 们 拍 到 更 多 的 好 照片 。 


Koenig: 几乎 所 有 的 照片 都 是 用 一 架 中 型 照相 机 拍摄 的 ， 它 又 大 又 重 ， 以 至 
于 在 1995 年 ， 有 一 次 旅行 时 ， 我 们 被 禁止 把 它 带 上 飞机 。 当 然 ， 现 在 飞机 对 于 行 
李 的 控制 更 加 严格 了 ， 所 以 我 觉得 不 太 可 能 带 着 这 人 台 相 机 去 中 国旅 游 。 现 在 我 只 
在 车 程 范围 内 进行 严肃 的 艺术 摄影 。 


提问 :最 后 一 个 问题 ， 我 们 都 希望 成 为 更 好 的 C++ 程序 员 。 请 给 我 们 三 个 你 
们 认为 最 重要 的 建议 ， 好 吗 ? 


Koenig & Moo: 

1. 避免 使 用 指针 ; 

2. 提倡 使 用 程序 库 ， 

3. 使 用 类 来 表示 概念 多 
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